可能是能反映AI在真实环境下情商的一道题?居然只有豆包完全答对了

提示词:解释这张图片的深意 需要模型理解的核心点是将高考说成平日限时训练的温柔感 线索:标准的高考时间,“完成限时小测不讲评,考完直接回家”的说法(显然指的是高考本身,而不是什么日常测验) 唯一且几乎完美的回答居然是Seed 2.0 Pro的: 其它模型几乎都牛头不对马嘴: 至少发现这是在祝福高考的...
可能是能反映AI在真实环境下情商的一道题?居然只有豆包完全答对了
可能是能反映AI在真实环境下情商的一道题?居然只有豆包完全答对了

提示词:解释这张图片的深意

image

需要模型理解的核心点是将高考说成平日限时训练的温柔感
线索:标准的高考时间,“完成限时小测不讲评,考完直接回家”的说法(显然指的是高考本身,而不是什么日常测验)

唯一且几乎完美的回答居然是Seed 2.0 Pro的:

image

其它模型几乎都牛头不对马嘴:

至少发现这是在祝福高考的模型:
Gemini 3.5 Flash:

image
Claude Opus 4.6:
image

完全胡言乱语的模型:
Gemini 3.1 Pro:

image
GLM 5V Turbo:
image
Qwen 3.7 Plus:
image
GPT 5.5:
image
Kimi K2.6:
image

6 个帖子 - 6 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文