GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同

编辑部 2026-05-04T15:16:37.523792 40557 阅读 tech

在 Kimi-K2.6技术报告中和 DeepSeek-v4技术报告中，Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同（Gemini和Calude是相同的），引用值分别为65.4和75.1，这是有什么讲究吗？ Kimi-K2.6技术报告截图如下： DeepSe...

GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同

在Kimi-K2.6技术报告中和DeepSeek-v4技术报告中，Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同（Gemini和Calude是相同的），引用值分别为65.4和75.1，这是有什么讲究吗？

Kimi-K2.6技术报告截图如下：

截屏2026-04-24 11.55.12

DeepSeek-v4技术报告截图如下：

截屏2026-04-24 11.55.22

6 个帖子 - 5 位参与者

阅读完整话题

来源: linux.do查看原文

GPT K2.6 DeepSeek v4 技术一个帖子使用