小米mimo全系降价,Token Plan额度重置

以下是官方公告: 尊敬的开发者, 感谢您一直以来对 Xiaomi MiMo 的支持!Xiaomi MiMo 团队持续优化推理性能,现将阶段性的降本成果回馈给开发者。 MiMo-V2.5 全系大幅调价,最高降幅 99% 新价格将于北京时间 2026.05.27 00:00 正式生效,不区分输入长度区间...
小米mimo全系降价,Token Plan额度重置
小米mimo全系降价,Token Plan额度重置

以下是官方公告:

尊敬的开发者,
感谢您一直以来对 Xiaomi MiMo 的支持!Xiaomi MiMo 团队持续优化推理性能,现将阶段性的降本成果回馈给开发者。

MiMo-V2.5 全系大幅调价,最高降幅 99%
新价格将于北京时间 2026.05.27 00:00 正式生效,不区分输入长度区间。V2 系列模型价格不变且即将下线,建议尽快切换新版模型。

  • MiMo-V2.5-Pro(/百万 tokens)
    • 输入(命中缓存):¥0.025 | 输入(未命中缓存):¥3 | 输出:¥6
  • MiMo-V2.5(/百万 tokens)
    • 输入(命中缓存):¥0.02 | 输入(未命中缓存):¥1 | 输出:¥2
  • MiMo-V2.5-TTS 系列 继续限时免费
    查看完整定价 →(link: Xiaomi MiMo API Open Platform

Token Plan 加量不加价

  • Credits 加量不加价:V2.5 系列模型用量可提升 5-8 倍;对 cache、输入、输出整体比例均有计量优化,整体更清晰。
  • Credits 用量再重置:所有仍在有效期的 Token Plan(包括参与百万亿 Token 创造者激励计划获得的 Token Plan,涵盖 Apache 软件基金会专属福利),无论当前套餐的用量如何,其已消耗的 Credits 额度将被完全重置,有效期不变。
  • One More Thing:针对 Token Plan 已过期的历史付费用户,我们也同样准备了惊喜好礼,将在未来一周宣布,请保持关注。
    了解 Token Plan → (link:Xiaomi MiMo API Open Platform)

「MiMo Orbit:百万亿 Token 创造者激励计划」圆满收官
激励计划自 2026.04.28 上线以来,受到全球用户的热情关注和广泛参与,截至北京时间 2026.05.26 16:08,100T Tokens 已全部发放完毕,活动提前收官、圆满结束,感谢广大开发者的踊跃支持!
查看详情 →(link: Xiaomi MiMo API Open Platform

推理技术优化说明
本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。
我们基于 SGLang HiCache 完整支持 SWA (Sliding Window Attentiom),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。

——Xiaomi MiMo API 开放平台团队

6 个帖子 - 6 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文