豆包 Claude以及GPT都不认识QQ飞车小橘子!

无聊的测试 豆包最离谱,先看他的回答 先说结论 根据我目前的简单测试结果 认识的有: ds3.2 qwen3.6 3.5max glm5.1 gemini2.5 3.1f-l 3.1p 不认识的有:Claude4.7 4.6s gpt5.3 gpt(app免费不思考) 豆包2.0… 4.7 glm5...
豆包 Claude以及GPT都不认识QQ飞车小橘子!
豆包 Claude以及GPT都不认识QQ飞车小橘子!

无聊的测试

豆包最离谱,先看他的回答

Screenshot20260421020620
Screenshot20260421020640

先说结论

根据我目前的简单测试结果 认识的有:
ds3.2 qwen3.6 3.5max glm5.1 gemini2.5 3.1f-l 3.1p
不认识的有:Claude4.7 4.6s gpt5.3 gpt(app免费不思考) 豆包2.0…

4.7

Screenshot20260421015824
glm5.1
Screenshot20260421020108
ds3.2
Screenshot20260421020127

4.6s

Screenshot20260421020318
gpt5.3chat
Screenshot20260421020322
qwen3.6p
Screenshot20260421020441
qwen3.5m
Screenshot20260421020524
gemma4
Screenshot20260421020722

Gemini2.5p

Screenshot20260421020745

所以之前4刚出来的时候,我说聊天体验和上下文检索能力匹敌2.5p 但是知识量这一块还是2.5p作为大模型更强一点~

Gemini3.1flash-lite

Screenshot20260421020759
3.1pro
Screenshot20260421021156

7 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文