以下是官方公告:
尊敬的开发者,
感谢您一直以来对 Xiaomi MiMo 的支持!Xiaomi MiMo 团队持续优化推理性能,现将阶段性的降本成果回馈给开发者。
MiMo-V2.5 全系大幅调价,最高降幅 99%
新价格将于北京时间 2026.05.27 00:00 正式生效,不区分输入长度区间。V2 系列模型价格不变且即将下线,建议尽快切换新版模型。
- MiMo-V2.5-Pro(/百万 tokens)
- 输入(命中缓存):¥0.025 | 输入(未命中缓存):¥3 | 输出:¥6
- MiMo-V2.5(/百万 tokens)
- 输入(命中缓存):¥0.02 | 输入(未命中缓存):¥1 | 输出:¥2
- MiMo-V2.5-TTS 系列 继续限时免费
查看完整定价 →(link: Xiaomi MiMo API Open Platform
Token Plan 加量不加价
- Credits 加量不加价:V2.5 系列模型用量可提升 5-8 倍;对 cache、输入、输出整体比例均有计量优化,整体更清晰。
- Credits 用量再重置:所有仍在有效期的 Token Plan(包括参与百万亿 Token 创造者激励计划获得的 Token Plan,涵盖 Apache 软件基金会专属福利),无论当前套餐的用量如何,其已消耗的 Credits 额度将被完全重置,有效期不变。
- One More Thing:针对 Token Plan 已过期的历史付费用户,我们也同样准备了惊喜好礼,将在未来一周宣布,请保持关注。
了解 Token Plan → (link:Xiaomi MiMo API Open Platform)
「MiMo Orbit:百万亿 Token 创造者激励计划」圆满收官
激励计划自 2026.04.28 上线以来,受到全球用户的热情关注和广泛参与,截至北京时间 2026.05.26 16:08,100T Tokens 已全部发放完毕,活动提前收官、圆满结束,感谢广大开发者的踊跃支持!
查看详情 →(link: Xiaomi MiMo API Open Platform
推理技术优化说明
本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。
我们基于 SGLang HiCache 完整支持 SWA (Sliding Window Attentiom),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。
——Xiaomi MiMo API 开放平台团队
6 个帖子 - 6 位参与者