中国移动发布 MoMA 平台：单位 Token 成本压降 30%，接入超 300 款 AI 模型

编辑部 2026-05-08T14:10:04.940577 25373 阅读综合

IT之家 5 月 8 日消息，中国移动今天发布移动模型服务平台 MoMA，接入超 300 款业界主流 AI 模型，首创 Token（词元）集约化运营模式，基于国产算力部署自研推理引擎打造。 IT之家从官方新闻稿了解到，MoMA 可提供统一 API 网关，目前已接入中国移动自研基座大模型“九天”，...

中国移动发布 MoMA 平台：单位 Token 成本压降 30%，接入超 300 款 AI 模型

IT之家 5 月 8 日消息，中国移动今天发布移动模型服务平台 MoMA，接入超 300 款业界主流 AI 模型，首创 Token（词元）集约化运营模式，基于国产算力部署自研推理引擎打造。

IT之家从官方新闻稿了解到，MoMA 可提供统一 API 网关，目前已接入中国移动自研基座大模型“九天”，以及 DeepSeek、通义千问、豆包、Kimi、GLM 等业界优质模型，覆盖文本生成、语音处理、多模态理解等多项能力，满足政务、金融、工业、医疗等场景应用需求。

MoMA 平台基于国产算力部署自研推理引擎打造，结合智能路由对长尾模型资源调度，实现单位 Token 成本压降约 30%、降低资源占用率 50% 以上。还能通过智能缓存、上下文复用、Token 压缩等技术进一步降低使用成本。

同时，该平台还首创智能路由引擎技术，可根据用户需求灵活切换“成本优先”“效果优先”“均衡优先”等三种策略，为用户动态匹配最适合的模型。当模型出现超时、限流或故障时，平台可自动实现秒级切换，确保业务连续不中断。

此外，MoMA 还带有“机密模型”服务，将模型部署在机密容器中，基于硬件隔离技术保障计算过程的数据安全，覆盖从芯片到应用的全链路机密计算，为政务、金融等数据安全要求较高的场景提供可靠支撑。

来源: IT之家查看原文

中国移动 MoMA 平台单位 Token 一个 IT AI

中国移动发布 MoMA 平台：单位 Token 成本压降 30%，接入超 300 款 AI 模型

[随想] 关于母情节的一点想法

[电动汽车] 蔚来 es6

相关推荐