GPT-5.5在 DeepSWE 上远超 Claude Opus

DeepSWE DeepSWE DeepSWE measures frontier coding agents on original, long-horizon software engineering tasks. 跑分也就图一乐,真要比较还得自己亲自用过 AI 生成内容已用截图发出 DeepS...
GPT-5.5在 DeepSWE 上远超 Claude Opus
GPT-5.5在 DeepSWE 上远超 Claude Opus
DeepSWE

DeepSWE

DeepSWE measures frontier coding agents on original, long-horizon software engineering tasks.

跑分也就图一乐,真要比较还得自己亲自用过
AI 生成内容已用截图发出

PixPin2026-05-2814-37-16

DeepSWE 的介绍:

PixPin2026-05-2814-38-24

3 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文