输入：0.5元/百万tokens（缓存命中）或2元（未命中）输出：8元/百万tokens

杏花春雨江南

于 2025-03-13 17:47:40 发布

阅读量747

点赞数 4

文章标签：缓存

本文链接：https://blog.youkuaiyun.com/jveqi/article/details/146238393

版权

这句话描述了一种 定价模型，通常用于云计算、API 服务或数据处理服务中，根据资源使用情况（如缓存命中与否）来收费。以下是对这句话的详细解释：

输入成本：
- 缓存命中：0.5 元/百万 Tokens。
  - 当数据从缓存中获取时，每处理 100 万个 Tokens 收费 0.5 元。
- 缓存未命中：2 元/百万 Tokens。
  - 当数据需要从原始数据源获取时，每处理 100 万个 Tokens 收费 2 元。
输出成本：8 元/百万 Tokens。
- 无论缓存是否命中，每生成或输出 100 万个 Tokens 收费 8 元。

假设你使用了一个 AI 模型或数据处理服务，该服务根据输入和输出的 Tokens 数量收费：

输入阶段：
- 如果你输入的数据已经在缓存中（缓存命中），则输入成本为 0.5 元/百万 Tokens。
- 如果数据不在缓存中（缓存未命中），则输入成本为 2 元/百万 Tokens。
输出阶段：
- 无论缓存是否命中，输出的 Tokens 都会按照 8 元/百万 Tokens 收费。

假设你输入了 500 万个 Tokens，并输出了 300 万个 Tokens：

情况 1：缓存命中
- 输入成本：0.5 元/百万 Tokens × 5 = 2.5 元。
- 输出成本：8 元/百万 Tokens × 3 = 24 元。
- 总成本：2.5 元 + 24 元 = 26.5 元。
情况 2：缓存未命中
- 输入成本：2 元/百万 Tokens × 5 = 10 元。
- 输出成本：8 元/百万 Tokens × 3 = 24 元。
- 总成本：10 元 + 24 元 = 34 元。