小米新token plan计价规则变化

这里只讨论token plan的规则变化,因为按量api也降价了,不考虑它本身的性价比变化了。 之前小米的token plan 价格上面 缓存token=输入token=输出token 佬可以看这个: 关于小米的token plan credit"计算缓存token"的问题 国产替代 这里其实有个坑...
小米新token plan计价规则变化
小米token plan计价规则变化

这里只讨论token plan的规则变化,因为按量api也降价了,不考虑它本身的性价比变化了。


之前小米的token plan 价格上面 缓存token=输入token=输出token

佬可以看这个:

关于小米的token plan credit"计算缓存token"的问题 国产替代
这里其实有个坑点,很多佬以为的credit量就是输入+输出,缓存应该是免掉的,但其实缓存是直接计数的,而且是和输入输出一样都是按1单位计数的,也就是无论是输入输出还是缓存,在小米这个token plan里是一样的。(或者再简单理解,你就当缓存是不存在的也好) 那么就会有人说了,那不是坑爹吗,读缓这么便宜,它这个token plan会不会比按量API还贵。 答案是不会的,因为它这个credit换…

所以有没有缓存其实是不重要的,因为计算价格完全一致。
但是新的就不太一样了。

我们按月费+不算任何折扣来计算,对应官网说明:

image
image

每Mtoken价格=月费(人民币)/月度 Credits×(每token所需Credits)×1M

  • Lite:39 / 4.1 = 9.512
  • Standard:99 / 11 = 9
  • Pro:329 / 38 = 8.658
  • Max:659 / 82 = 8.037
    (单位是 10^-9 元/Credit

Pro和非Pro价格分别是:

image

老pro的价格是:

屏幕截图 2026-05-27 105156

可以看出缓存token变得很便宜了

比率和涨跌幅:

image
简化一下表格:
image

让AI估算了下新套餐更优的条件:

image

在大部分代码场景下,输出一般不会超过总量的10%,缓存能达到90%+,这样的情况新套餐更优。
但是对于无缓存或者缓存很少的场景,那新套餐反而不行了(这其实就是和之前token plan反过来了。。之前token plan缓存多反而性价比低。。。。)

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文