看到 V4 Pro 的 SimpleQA 比 GPT 和 Claude 强很多,又看到 Gemini 的 SimpleQA 比 V4 强很多。
正好最近看到一个比较抽象的梗,就问了一下这几个 AI,都没开联网
prompt (点击了解更多详细信息)最后只有 Gemini 能答出来,而且不仅是 Gemini 3.1 Pro,3 Flash 开 low 也能答对。
V4、K2.6、Qwen 3.6 Max 什么的都没答出来
当然 Gemini Web 不知道降成啥了就别说了。
4 个帖子 - 4 位参与者