

本文为您介绍快手万擎平台资源包计费方式及抵扣规则。如需查询各模型的计费公式及单价请参考模型服务价格。
资源包token是实际扣减单位,由于不同模型的输入、输出、缓存命中的成本不同,为保证每位用户的公平性,会基于用户使用的不同类型实际token消耗✖️抵扣系数进行资源包余量扣减。
| 实际消耗token以控制台-用量统计页面为准 | 实际抵扣资源包token以控制台-账单详情-账单明细为准 |
|---|---|
每个模型的资源包token会以其「输入」价格为扣减系数1,「输出」及「缓存」会按照输入价格进行等比换算系数抵扣。
例如:
模型A的输入价格为2元/百万token,输出价格为8元/百万token,输出价格为8元/百万token,命中缓存价格为0.4元/百万token;
那么用户每消耗1个input_token(不含cache)则抵扣1个资源包token,每消耗1个output_token则抵扣4个资源包token ,每命中1个prefix_cache则抵扣0.2个资源包token 。
| token类型 | A模型,token原价(元/百万token) | 资源包抵扣系数 |
|---|---|---|
| 输入 | 4元/百万token | 1 |
| 缓存 | 0.8元/百万token | 0.2 |
| 输出 | 16元/百万token | 4 |
对于按长度分段计价的模型,以最小分段的输入token为系数1,其余类型的用量等比换算系数抵扣。
系统按小时出账,账单出账时间通常在当前计费周期结束后1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。
出账后会自动使用资源包token进行抵扣,若资源包余量不足以抵扣,会自动产生后付费账单。
若存在多个资源包,抵扣顺序以到期时间最近的为优先抵扣;若到期时间相同,以最早生效的资源包为优先抵扣。
说明:
因模型升级和相关资源包规则调整,KAT-Coder-Pro V1模型原“新用户免费2000万tokens体验活动”的资源包将于2026年1月5日00:00(UTC+8)自动失效,未消耗完的资源包余量将作废。如有有异议请联系StreamLake平台客服。