可能是能反映AI在真实环境下情商的一道题？居然只有豆包完全答对了

编辑部 2026-05-23T16:31:15.128509 46837 阅读 tech

提示词：解释这张图片的深意需要模型理解的核心点是将高考说成平日限时训练的温柔感线索：标准的高考时间，“完成限时小测不讲评，考完直接回家”的说法（显然指的是高考本身，而不是什么日常测验）唯一且几乎完美的回答居然是Seed 2.0 Pro的：其它模型几乎都牛头不对马嘴：至少发现这是在祝福高考的...

提示词：解释这张图片的深意

需要模型理解的核心点是将高考说成平日限时训练的温柔感
线索：标准的高考时间，“完成限时小测不讲评，考完直接回家”的说法（显然指的是高考本身，而不是什么日常测验）

唯一且几乎完美的回答居然是Seed 2.0 Pro的：

其它模型几乎都牛头不对马嘴：

至少发现这是在祝福高考的模型：
Gemini 3.5 Flash:

Claude Opus 4.6:

完全胡言乱语的模型：
Gemini 3.1 Pro:

GLM 5V Turbo:

Qwen 3.7 Plus:

GPT 5.5:

Kimi K2.6:

6 个帖子 - 6 位参与者

来源: LinuxDo 最新话题查看原文

可能反映 AI 真实环境帖子一个 IT

相关推荐