kim2.6评测第一名,国产跟上了,还超越了

单词宝石拼图。十位模特参赛。结果出乎大多数人的预料。来自中国初创公司Moonshot AI的开放权重模型Kimi K2.6以22个赛点、7-1-0的成绩彻底赢得了挑战。小米的MiMo V2-Pro位居第二。 GPT-5.5 排名第三。 Claude Opus 4.7 获得第五名。来自西方前沿实验室的...
kim2.6评测第一名,国产跟上了,还超越了
kim2.6评测第一名,国产跟上了,还超越了

单词宝石拼图。十位模特参赛。结果出乎大多数人的预料。来自中国初创公司Moonshot AI的开放权重模型Kimi K2.6以22个赛点、7-1-0的成绩彻底赢得了挑战。小米的MiMo V2-Pro位居第二。 GPT-5.5 排名第三。 Claude Opus 4.7 获得第五名。来自西方前沿实验室的每个模型都低于前两名。

IMG0310

11 个帖子 - 11 位参与者

阅读完整话题

来源: linux.do查看原文