[问与答] 看到小米 AI 降价的消息，这个 Plan 是不是并没有比按量 API 便宜多少？

编辑部 2026-05-27T10:25:57.226251 42261 阅读 tech

主要想用在文本处理优化、普通多轮问答、多模态理解，已经有 codex 了，所以不太做编程 Agent 。我咨询了一下 GPT ，如果只是纯文字普通问答，Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多，大家有没有实际使用的分享一下体感？下面是 GPT...

[问与答] 看到小米 AI 降价的消息，这个 Plan 是不是并没有比按量 API 便宜多少？

主要想用在文本处理优化、普通多轮问答、多模态理解，已经有 codex 了，所以不太做编程 Agent 。

我咨询了一下 GPT ，如果只是纯文字普通问答，Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多，大家有没有实际使用的分享一下体感？

下面是 GPT 给的一些计算逻辑：

一、官方按量 API 价格

小米 MiMo-V2.5-Pro 最新按量价：

国内：缓存命中输入 ¥0.025 / M tokens ，未命中输入 ¥3 / M ，输出 ¥6 / M
海外：缓存命中输入 $0.0036 / M ，未命中输入 $0.435 / M ，输出 $0.87 / M

小米 MiMo-V2.5 最新按量价：

国内：缓存命中输入 ¥0.02 / M ，未命中输入 ¥1 / M ，输出 ¥2 / M
海外：缓存命中输入 $0.0028 / M ，未命中输入 $0.14 / M ，输出 $0.28 / M

这个价格基本贴近 DeepSeek V4：

DeepSeek V4-Pro：$0.003625 / $0.435 / $0.87
DeepSeek V4-Flash：$0.0028 / $0.14 / $0.28

所以单看按量 API ，MiMo-V2.5-Pro ≈ DeepSeek V4-Pro ，MiMo-V2.5 ≈ DeepSeek V4-Flash 。

二、Token Plan 的 Credits 扣费规则

小米 FAQ 写的是：

MiMo-V2.5-Pro：

缓存命中输入：2.5 Credits / token
未命中输入：300 Credits / token
输出：600 Credits / token

MiMo-V2.5：

缓存命中输入：2 Credits / token
未命中输入：100 Credits / token
输出：200 Credits / token

Lite 套餐是 4.1B Credits 。官方例子也写了：用 10M MiMo-V2.5-Pro 未命中输入 token ，会消耗 3000M Credits ，还剩 1100M Credits 。

按这个比例推，人民币口径下大概可以理解为：

1B Credits ≈ ¥10 的按量 API 价值。

因为：

V2.5-Pro 输入 ¥3/M ，对应 300 Credits/token ，也就是 300M Credits ≈ ¥3
V2.5-Pro 输出 ¥6/M ，对应 600 Credits/token ，也就是 600M Credits ≈ ¥6
V2.5 输入 ¥1/M ，对应 100 Credits/token ，也就是 100M Credits ≈ ¥1
V2.5 输出 ¥2/M ，对应 200 Credits/token ，也就是 200M Credits ≈ ¥2

所以我理解是：Credits 的设计基本就是按最新按量 API 价格倒推出来的。

三、套餐实际价值粗算

按人民币口径，如果 1B Credits ≈ ¥10 API 价值：

Lite：4.1B Credits ≈ ¥41 API 价值
Standard：11B Credits ≈ ¥110 API 价值
Pro：38B Credits ≈ ¥380 API 价值
Max：82B Credits ≈ ¥820 API 价值

如果对应月费是大约：

Lite ¥39
Standard ¥99
Pro ¥329
Max ¥659

那正常月付的折扣大概是：

Lite：¥39 买约 ¥41 API 价值，约省 5%
Standard：¥99 买约 ¥110 API 价值，约省 10%
Pro：¥329 买约 ¥380 API 价值，约省 13%
Max：¥659 买约 ¥820 API 价值，约省 20%

也就是说，小套餐几乎不省钱，大套餐才有一点批发折扣。这个结论有点超过我的预期，因为“包月 Plan”听起来应该比按量 API 明显便宜很多。

四、海外社区也有人类似换算

我看到 Reddit / opencodeCLI 有人按 Lite $6 / 4.1B Credits 计算：

Lite 档下 MiMo-V2.5-Pro 大约是：

cache hit input：$0.00366 / M
cache miss input：$0.439 / M
output：$0.878 / M

这几乎贴着 DeepSeek V4-Pro：

$0.003625 / $0.435 / $0.87

Max 档 $100 / 82B Credits 才会低一些，大概变成：

V2.5-Pro cache miss input：$0.366 / M
output：$0.732 / M

也就是 Max 大概比 DeepSeek / 按量基准便宜 15% 左右。

五、我的疑问

我这个换算逻辑有没有问题？
Token Plan 是不是本质就是“预付 Credits 包”，不是传统意义上的包月订阅？
如果按量 API 已经这么便宜，Token Plan 对普通用户的意义是不是主要只有：
- 首购 / 年付 / 自动续费优惠
- 非高峰 0.8x
- 避免频繁充值
- 多模态 + TTS 免费期
对普通多轮问答用户来说，是不是 Lite / Standard 够试水，Pro / Max 只有在稳定高用量且能用完额度时才划算？

来源: v2ex查看原文

问与答看到小米 AI 降价一个帖子 IT

[问与答] 看到小米 AI 降价的消息，这个 Plan 是不是并没有比按量 API 便宜多少？

OPPO Reno16 系列手机全新毕业季影像故事片定档 5 月 29 日首映

[推广] 自建 AI 中转站，新用户送 $10 永久额度 + 免费订阅套餐，欢迎试用

相关推荐