MiniMax M3测评:进步了,但雷霆大思考

今天早上测这么几道题给我截断了一万次。思考效率比deepseek都差,经常是思维链吃满output token就断了 总之就是,相比于自家的2.5和2.7进步卓著,并且M3拓展到了1M上下文并且有多模态。能力还算说的过去 能力实际来说中等偏下,和半年前的GLM5打个平手。 但是还是要说,这个API价...
MiniMax M3测评:进步了,但雷霆大思考
MiniMax M3测评:进步了,但雷霆大思考

image
今天早上测这么几道题给我截断了一万次。思考效率比deepseek都差,经常是思维链吃满output token就断了
image

总之就是,相比于自家的2.5和2.7进步卓著,并且M3拓展到了1M上下文并且有多模态。能力还算说的过去

image
image
image
能力实际来说中等偏下,和半年前的GLM5打个平手。

但是还是要说,这个API价格不太美丽呢,就算走code plan也是有点小贵的

image

5 个帖子 - 4 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文