Xiaomi MiMo-V2.5 系列大模型开启公测并即将开源:或能与Opus4.6、GPT5.4正面较量

MiMo-V2.5-Pro 是我们迄今最强大的模型。在 通用 智能体 能力、复杂软件工程以及长程任务 等维度上,它已能与全球顶尖 Agent 模型(Claude Opus 4.6、GPT-5.4 ) 正面较量 ,相较上一代 MiMo-V2-Pro 实现了全方位跃升。 案例一:该任务源自北京大学《编译...
Xiaomi MiMo-V2.5 系列大模型开启公测并即将开源:或能与Opus4.6、GPT5.4正面较量
Xiaomi MiMo-V2.5 系列大模型开启公测并即将开源:或能与Opus4.6、GPT5.4正面较量

image

MiMo-V2.5-Pro 是我们迄今最强大的模型。在通用 智能体 能力、复杂软件工程以及长程任务 等维度上,它已能与全球顶尖 Agent 模型(Claude Opus 4.6、GPT-5.4 )正面较量,相较上一代 MiMo-V2-Pro 实现了全方位跃升。

image

案例一:该任务源自北京大学《编译原理》课程项目,要求模型用 Rust 从零实现一个完整的 SysY 编译器:词法分析器、语法分析器、AST、Koopa IR 代码生成、RISC-V 汇编后端,以及性能优化。作为参考,北大本科生完成该项目通常需要 数周 时间 ,然而 MiMo-V2.5-Pro 用时 4.3 小时 、经过 672 次工具调用完成全部工作,在隐藏测试集上取得 233/233 的满分 ,展现了极高效的生产力价值。

案例二:仅凭几句简单指令——“构建一个视频编辑器 Web 应用”——MiMo-V2.5-Pro 便交付了一款可运行的 Web 应用:具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。最终构建的代码量达 8,192 行,历经 1,868 次工具调用,在 11.5 小时的自主工作中完成。

Xiaomi MiMo-V2.5 系列大模型开启公测并即将开源:或能与Opus4.6、GPT5.4正面较量 前沿快讯
[image] 关键是token plan也发生了变化

https://mp.weixin.qq.com/s/ikHvKgVeLILebVMWeF1amQ

35 个帖子 - 28 位参与者

阅读完整话题

来源: linux.do查看原文