这里只讨论token plan的规则变化,因为按量api也降价了,不考虑它本身的性价比变化了。
之前小米的token plan 价格上面 缓存token=输入token=输出token
佬可以看这个:
这里其实有个坑点,很多佬以为的credit量就是输入+输出,缓存应该是免掉的,但其实缓存是直接计数的,而且是和输入输出一样都是按1单位计数的,也就是无论是输入输出还是缓存,在小米这个token plan里是一样的。(或者再简单理解,你就当缓存是不存在的也好) 那么就会有人说了,那不是坑爹吗,读缓这么便宜,它这个token plan会不会比按量API还贵。 答案是不会的,因为它这个credit换…
所以有没有缓存其实是不重要的,因为计算价格完全一致。
但是新的就不太一样了。
我们按月费+不算任何折扣来计算,对应官网说明:

每Mtoken价格=月费(人民币)/月度 Credits×(每token所需Credits)×1M
- Lite:39 / 4.1 = 9.512
- Standard:99 / 11 = 9
- Pro:329 / 38 = 8.658
- Max:659 / 82 = 8.037
(单位是 10^-9 元/Credit
Pro和非Pro价格分别是:
老pro的价格是:
可以看出缓存token变得很便宜了
比率和涨跌幅:

简化一下表格:
让AI估算了下新套餐更优的条件:
在大部分代码场景下,输出一般不会超过总量的10%,缓存能达到90%+,这样的情况新套餐更优。
但是对于无缓存或者缓存很少的场景,那新套餐反而不行了(这其实就是和之前token plan反过来了。。之前token plan缓存多反而性价比低。。。。)
1 个帖子 - 1 位参与者