logologo
售前咨询
快手万擎
开始使用
产品公告
模型介绍
产品计费
API说明
控制台介绍
相关协议
文档中心
开始使用产品公告模型发布公告

模型发布公告


本文介绍了快手万擎大模型服务平台的大模型发布记录,欢迎用户前来体验,如有问题可联系平台客服。若需API调用,可参考:API 调用指南

发布时间:2025年8月

更新时间

模型名称

模型版本

模型类型

模型介绍

8月15日

DeepSeek-R1

DeepSeek-R1

文本生成

深度思考

DeepSeek-R1 是由深度求索推出的推理大模型。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

8月15日

DeepSeek V3

DeepSeek V3

文本生成

DeepSeek-V3 由 DeepSeek 开源,具备高质量预训练、可扩展的 MoE 架构(Mixture-of-Experts)、以及完整的推理和部署工具链。适合在企业、科研与开源社区中广泛应用。

8月15日

Qwen2.5

Qwen2.5-7B-Instruct

文本生成

Qwen2.5-7B-Instruct 是通义千问团队于2024年发布的一款开源大语言模型,属于 Qwen2.5 系列,具有约70亿参数。

8月15日

Qwen2.5

Qwen2.5-72B-Instruct

文本生成

Qwen2.5-72B-Instruct 是通义千问团队于2024年9月发布的一款大型语言模型,具备720亿参数,专为指令理解与执行优化,广泛应用于多语言处理、数学推理、代码生成等领域。

8月15日

Qwen3

Qwen3-8B

文本生成

深度思考

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界 SOTA 水平、通用能力显著超过 Qwen2.5-7B。

8月15日

Qwen3

Qwen3-32B

文本生成

深度思考

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过 QwQ、通用能力显著超过 Qwen2.5-32B-Instruct,达到同规模业界 SOTA 水平。

8月15日

Qwen3

Qwen3-30B-A3B

文本生成

一个拥有约300亿总参数和30亿激活参数的小型 MoE 模型。

上一篇:产品更新公告下一篇:“快手万擎千万Tokens免费体验”活动规则详情页
该篇文档内容是否对您有帮助?
有帮助没帮助