关于小米的token plan credit"计算缓存token"的问题

这里其实有个坑点,很多佬以为的credit量就是输入+输出,缓存应该是免掉的,但其实缓存是直接计数的,而且是和输入输出一样都是按1单位计数的,也就是无论是输入输出还是缓存,在小米这个token plan里是一样的。(或者再简单理解,你就当缓存是不存在的也好) 那么就会有人说了,那不是坑爹吗,读缓这么...
关于小米的token plan credit"计算缓存token"的问题
关于小米的token plan credit"计算缓存token"的问题

这里其实有个坑点,很多佬以为的credit量就是输入+输出,缓存应该是免掉的,但其实缓存是直接计数的,而且是和输入输出一样都是按1单位计数的,也就是无论是输入输出还是缓存,在小米这个token plan里是一样的。(或者再简单理解,你就当缓存是不存在的也好)

那么就会有人说了,那不是坑爹吗,读缓这么便宜,它这个token plan会不会比按量API还贵。
答案是不会的,因为它这个credit换算成token之后,每token价格是比读缓还低的。

这是各档位token plan的Pro模型按量token单价(1M,已经换算成token了)

image

这是按量原价

image

这是原价相比token plan的倍率(原价API​:divide:token plan,越大越比原价API便宜)

image

也就是对于Lite来说 它的token单价和256K以内的读缓相差不多,其他都比读缓便宜。

所以他们定价的时候就考虑到比读缓便宜的问题了。


这个比较讽刺的一点就是,如果你读缓命中高,这个token plan其实有点亏,但是你一点缓存都没有,那就是血赚(比较输入/输出 价格更贵)。

不过这个token plan还是不太推荐,因为它本质是个流量包,而且还是个按月的流量包(别家很多流量包的卖法是付费购买不需要订阅,而且过期时间更长),比别家的coding plan综合是贵不少的。

4 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文