Mimo v2.5 Pro测评:进步不错,问题也大

放私有bench mimo 2.0 pro测评 米÷来袭,学习先进的GLM工艺,Mimo v2 Pro正式版依旧大砍 开发调优 [image] 比较匿名时期的Hunter-alpha能力差了一大截,代码基本不可用,全部都要返工修小bug。从小巧思还能看出hunter的影子,但是能力差太多 [imag...
Mimo v2.5 Pro测评:进步不错,问题也大
Mimo v2.5 Pro测评:进步不错,问题也大

放私有bench

image

mimo 2.0 pro测评

米÷来袭,学习先进的GLM工艺,Mimo v2 Pro正式版依旧大砍 开发调优
[image] 比较匿名时期的Hunter-alpha能力差了一大截,代码基本不可用,全部都要返工修小bug。从小巧思还能看出hunter的影子,但是能力差太多 [image] 现在写的东西已经不是人类了 [image] [image] 我看罗福莉离开deepseek是对的啊

这个模型的基础还算扎实,但是比glm还差点。
而且很多有背题嫌疑

image
比如这个MC,看起来写的相当不错,但是竟然存在无法跳跃的bug。遥想2.0p时期写出来的MC,不知道背的谁家,,
image
image
这个案例里,其他逻辑都还行,结果建筑绘制拉了

而且在测试途中,爆思维链的现象非常严重

image
罗福莉你看你带的兵
思维链无限循环撑爆上下文,然后空回

不过还是要感叹一下,小米这个迭代速度有点吓人了。现在这llm公司们都卷疯了,,

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文