GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同

在 Kimi-K2.6技术报告 中和 DeepSeek-v4技术报告 中,Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同(Gemini和Calude是相同的),引用值分别为65.4和75.1,这是有什么讲究吗? Kimi-K2.6技术报告截图如下: DeepSe...
GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同
GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同

Kimi-K2.6技术报告中和DeepSeek-v4技术报告中,Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同(Gemini和Calude是相同的),引用值分别为65.4和75.1,这是有什么讲究吗?

Kimi-K2.6技术报告截图如下:

截屏2026-04-24 11.55.12

DeepSeek-v4技术报告截图如下:

截屏2026-04-24 11.55.22

6 个帖子 - 5 位参与者

阅读完整话题

来源: linux.do查看原文