主要想用在文本处理优化、普通多轮问答、多模态理解,已经有 codex 了,所以不太做编程 Agent 。
我咨询了一下 GPT ,如果只是纯文字普通问答,Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多,大家有没有实际使用的分享一下体感?
下面是 GPT 给的一些计算逻辑:
[Wunder] edge.v2ex.com/chat 功能示例 · 总结一个有很多回复的主题
[Wunder] edge.v2ex.com/chat 功能示例 · 总结一个有很多回复的主题
一、官方按量 API 价格
小米 MiMo-V2.5-Pro 最新按量价:
- 国内:缓存命中输入 ¥0.025 / M tokens ,未命中输入 ¥3 / M ,输出 ¥6 / M
- 海外:缓存命中输入 $0.0036 / M ,未命中输入 $0.435 / M ,输出 $0.87 / M
小米 MiMo-V2.5 最新按量价:
- 国内:缓存命中输入 ¥0.02 / M ,未命中输入 ¥1 / M ,输出 ¥2 / M
- 海外:缓存命中输入 $0.0028 / M ,未命中输入 $0.14 / M ,输出 $0.28 / M
这个价格基本贴近 DeepSeek V4:
- DeepSeek V4-Pro:$0.003625 / $0.435 / $0.87
- DeepSeek V4-Flash:$0.0028 / $0.14 / $0.28
所以单看按量 API ,MiMo-V2.5-Pro ≈ DeepSeek V4-Pro ,MiMo-V2.5 ≈ DeepSeek V4-Flash 。
二、Token Plan 的 Credits 扣费规则
小米 FAQ 写的是:
MiMo-V2.5-Pro:
- 缓存命中输入:2.5 Credits / token
- 未命中输入:300 Credits / token
- 输出:600 Credits / token
MiMo-V2.5:
- 缓存命中输入:2 Credits / token
- 未命中输入:100 Credits / token
- 输出:200 Credits / token
Lite 套餐是 4.1B Credits 。官方例子也写了:用 10M MiMo-V2.5-Pro 未命中输入 token ,会消耗 3000M Credits ,还剩 1100M Credits 。
按这个比例推,人民币口径下大概可以理解为:
1B Credits ≈ ¥10 的按量 API 价值。
因为:
- V2.5-Pro 输入 ¥3/M ,对应 300 Credits/token ,也就是 300M Credits ≈ ¥3
- V2.5-Pro 输出 ¥6/M ,对应 600 Credits/token ,也就是 600M Credits ≈ ¥6
- V2.5 输入 ¥1/M ,对应 100 Credits/token ,也就是 100M Credits ≈ ¥1
- V2.5 输出 ¥2/M ,对应 200 Credits/token ,也就是 200M Credits ≈ ¥2
所以我理解是:Credits 的设计基本就是按最新按量 API 价格倒推出来的。
三、套餐实际价值粗算
按人民币口径,如果 1B Credits ≈ ¥10 API 价值:
- Lite:4.1B Credits ≈ ¥41 API 价值
- Standard:11B Credits ≈ ¥110 API 价值
- Pro:38B Credits ≈ ¥380 API 价值
- Max:82B Credits ≈ ¥820 API 价值
如果对应月费是大约:
- Lite ¥39
- Standard ¥99
- Pro ¥329
- Max ¥659
那正常月付的折扣大概是:
- Lite:¥39 买约 ¥41 API 价值,约省 5%
- Standard:¥99 买约 ¥110 API 价值,约省 10%
- Pro:¥329 买约 ¥380 API 价值,约省 13%
- Max:¥659 买约 ¥820 API 价值,约省 20%
也就是说,小套餐几乎不省钱,大套餐才有一点批发折扣。这个结论有点超过我的预期,因为“包月 Plan”听起来应该比按量 API 明显便宜很多。
四、海外社区也有人类似换算
我看到 Reddit / opencodeCLI 有人按 Lite $6 / 4.1B Credits 计算:
Lite 档下 MiMo-V2.5-Pro 大约是:
- cache hit input:$0.00366 / M
- cache miss input:$0.439 / M
- output:$0.878 / M
这几乎贴着 DeepSeek V4-Pro:
- $0.003625 / $0.435 / $0.87
Max 档 $100 / 82B Credits 才会低一些,大概变成:
- V2.5-Pro cache miss input:$0.366 / M
- output:$0.732 / M
也就是 Max 大概比 DeepSeek / 按量基准便宜 15% 左右。
五、我的疑问
- 我这个换算逻辑有没有问题?
- Token Plan 是不是本质就是“预付 Credits 包”,不是传统意义上的包月订阅?
-
如果按量 API 已经这么便宜,Token Plan 对普通用户的意义是不是主要只有:
- 首购 / 年付 / 自动续费优惠
- 非高峰 0.8x
- 避免频繁充值
- 多模态 + TTS 免费期
- 对普通多轮问答用户来说,是不是 Lite / Standard 够试水,Pro / Max 只有在稳定高用量且能用完额度时才划算?