[问与答] 看到小米 AI 降价的消息,这个 Plan 是不是并没有比按量 API 便宜多少?

主要想用在文本处理优化、普通多轮问答、多模态理解,已经有 codex 了,所以不太做编程 Agent 。 我咨询了一下 GPT ,如果只是纯文字普通问答,Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多,大家有没有实际使用的分享一下体感? 下面是 GPT...
[问与答] 看到小米 AI 降价的消息,这个 Plan 是不是并没有比按量 API 便宜多少?
[问与答] 看到小米 AI 降价的消息,这个 Plan 是不是并没有比按量 API 便宜多少?

主要想用在文本处理优化、普通多轮问答、多模态理解,已经有 codex 了,所以不太做编程 Agent 。

我咨询了一下 GPT ,如果只是纯文字普通问答,Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多,大家有没有实际使用的分享一下体感?

下面是 GPT 给的一些计算逻辑:

一、官方按量 API 价格

小米 MiMo-V2.5-Pro 最新按量价:

  • 国内:缓存命中输入 ¥0.025 / M tokens ,未命中输入 ¥3 / M ,输出 ¥6 / M
  • 海外:缓存命中输入 $0.0036 / M ,未命中输入 $0.435 / M ,输出 $0.87 / M

小米 MiMo-V2.5 最新按量价:

  • 国内:缓存命中输入 ¥0.02 / M ,未命中输入 ¥1 / M ,输出 ¥2 / M
  • 海外:缓存命中输入 $0.0028 / M ,未命中输入 $0.14 / M ,输出 $0.28 / M

这个价格基本贴近 DeepSeek V4:

  • DeepSeek V4-Pro:$0.003625 / $0.435 / $0.87
  • DeepSeek V4-Flash:$0.0028 / $0.14 / $0.28

所以单看按量 API ,MiMo-V2.5-Pro ≈ DeepSeek V4-Pro ,MiMo-V2.5 ≈ DeepSeek V4-Flash 。

二、Token Plan 的 Credits 扣费规则

小米 FAQ 写的是:

MiMo-V2.5-Pro:

  • 缓存命中输入:2.5 Credits / token
  • 未命中输入:300 Credits / token
  • 输出:600 Credits / token

MiMo-V2.5:

  • 缓存命中输入:2 Credits / token
  • 未命中输入:100 Credits / token
  • 输出:200 Credits / token

Lite 套餐是 4.1B Credits 。官方例子也写了:用 10M MiMo-V2.5-Pro 未命中输入 token ,会消耗 3000M Credits ,还剩 1100M Credits 。

按这个比例推,人民币口径下大概可以理解为:

1B Credits ≈ ¥10 的按量 API 价值。

因为:

  • V2.5-Pro 输入 ¥3/M ,对应 300 Credits/token ,也就是 300M Credits ≈ ¥3
  • V2.5-Pro 输出 ¥6/M ,对应 600 Credits/token ,也就是 600M Credits ≈ ¥6
  • V2.5 输入 ¥1/M ,对应 100 Credits/token ,也就是 100M Credits ≈ ¥1
  • V2.5 输出 ¥2/M ,对应 200 Credits/token ,也就是 200M Credits ≈ ¥2

所以我理解是:Credits 的设计基本就是按最新按量 API 价格倒推出来的。

三、套餐实际价值粗算

按人民币口径,如果 1B Credits ≈ ¥10 API 价值:

  • Lite:4.1B Credits ≈ ¥41 API 价值
  • Standard:11B Credits ≈ ¥110 API 价值
  • Pro:38B Credits ≈ ¥380 API 价值
  • Max:82B Credits ≈ ¥820 API 价值

如果对应月费是大约:

  • Lite ¥39
  • Standard ¥99
  • Pro ¥329
  • Max ¥659

那正常月付的折扣大概是:

  • Lite:¥39 买约 ¥41 API 价值,约省 5%
  • Standard:¥99 买约 ¥110 API 价值,约省 10%
  • Pro:¥329 买约 ¥380 API 价值,约省 13%
  • Max:¥659 买约 ¥820 API 价值,约省 20%

也就是说,小套餐几乎不省钱,大套餐才有一点批发折扣。这个结论有点超过我的预期,因为“包月 Plan”听起来应该比按量 API 明显便宜很多。

四、海外社区也有人类似换算

看到 Reddit / opencodeCLI 有人按 Lite $6 / 4.1B Credits 计算:

Lite 档下 MiMo-V2.5-Pro 大约是:

  • cache hit input:$0.00366 / M
  • cache miss input:$0.439 / M
  • output:$0.878 / M

这几乎贴着 DeepSeek V4-Pro:

  • $0.003625 / $0.435 / $0.87

Max 档 $100 / 82B Credits 才会低一些,大概变成:

  • V2.5-Pro cache miss input:$0.366 / M
  • output:$0.732 / M

也就是 Max 大概比 DeepSeek / 按量基准便宜 15% 左右。

五、我的疑问

  1. 我这个换算逻辑有没有问题?
  2. Token Plan 是不是本质就是“预付 Credits 包”,不是传统意义上的包月订阅?
  3. 如果按量 API 已经这么便宜,Token Plan 对普通用户的意义是不是主要只有:
    • 首购 / 年付 / 自动续费优惠
    • 非高峰 0.8x
    • 避免频繁充值
    • 多模态 + TTS 免费期
  4. 对普通多轮问答用户来说,是不是 Lite / Standard 够试水,Pro / Max 只有在稳定高用量且能用完额度时才划算?
来源: v2ex查看原文