本文介绍了快手万擎大模型服务平台的版本更新详情,欢迎用户前来体验,如有问题可联系平台客服。
发布时间:2026年1月
更新时间 | 功能模块 | 功能说明 | 帮助文档 |
1月22日 | 模型研发 | - 【新增】通过开发机为用户提供在线交互式开发环境,专为 AI 模型研发场景设计。
| 模型研发 |
1月20日 | 模型推理 | - 【优化】推理点限流、模型限流增加图片提示,限流逻辑更清晰。
| 模型推理 |
1月15日 | 模型部署 | | 模型部署 |
2025年万擎需求汇总
更新时间 | 功能模块 | 功能说明 | 帮助文档 |
2025年12月 | 模型量化 | - 【新增】在不严重损失模型精度的情况下,对模型进行压缩,为推理提速。
| 模型量化 |
2025年12月 | 模型评测 | - 【新增】模型性能评测,测试模型服务在各种压力下的稳定性、效率和资源消耗。
| 性能评测 |
2025年12月 | 模型托管 | - 【新增】新增模型单元,将算力打包为标准化商品,降低用户使用门槛。
- 【新增】模型仓库支持自定义上传模型,模型来源更丰富。
| 模型部署 模型仓库 |
2025年12月 | 模型推理 | - 【新增】在线推理新增预置推理点,用户可快速接入模型。
| 模型推理 |
2025年12月 | 模型广场 | - 【优化】透出剩余免费Token额度及总额度情况。
- 【新增】支持KAT系列模型API快捷调用。
| 模型广场 |
2025年11月 | 模型广场 | | 模型广场 |
2025年11月 | 模型评测 | - 【新增】模型效果评测上线自动评测,来判断模型在不同任务类型下的性能。
| 效果评测 |
2025年9月 | 模型精调 | - 【新增】模型微调功能,用户可通过监督学习等方式对模型参数进行优化,使其更加适配业务场景。
| 模型微调 |
2025年9月 | 模型托管 | - 【新增】模型仓库功能,用户可集中管理微调产出的模型,并对模型进行增量训练、评测及部署。
| 模型仓库 |
2025年9月 | 模型托管 | - 【新增】模型部署功能,用户可对当前项目下【模型仓库】中的模型进行私有化部署的全链路管理。
| 模型部署 |
2025年9月 | 模型评测 | - 【新增】模型评测功能,用户可选择人工评测来判断模型在不同任务类型下的性能。
| 效果评测 |
2025年9月 | 数据集 | - 【新增】数据集功能,平台统一纳管用于模型微调、模型评测的数据集,包含项目数据集、平台预置的数据集。
| 数据集 |
2025年8月 | 模型广场 | - 【新增】模型广场功能,用户可以查看及体验模型在语言、图像等方面的先进能力。
| 模型广场 |
2025年8月 | 模型推理 | - 【新增】在线推理能力,用户可获得模型的即时反馈,实时体验语言生成、图像理解等能力。
- 【新增】批量推理能力,用户上传海量数据后模型完成离线预测,批量生成报表、历史分析结果等。
| 模型推理 |
2025年8月 | 调用监控与用量统计 | - 【新增】调用监控能力,用户可查看账户下推理服务的调用情况、token消耗数量等信息。
- 【新增】用量统计能力,用户可查看账户下模型的token消耗数量、输入/输出token总数等信息。
| 调用监控 用量统计 |
2025年8月 | API KEY管理 | - 【新增】用户可在平台创建和管理API Key,简单完成调用步骤。
| API KEY管理 |