无聊的测试
豆包最离谱,先看他的回答

先说结论
根据我目前的简单测试结果 认识的有:
ds3.2 qwen3.6 3.5max glm5.1 gemini2.5 3.1f-l 3.1p
不认识的有:Claude4.7 4.6s gpt5.3 gpt(app免费不思考) 豆包2.0…
4.7

glm5.1

ds3.2
4.6s

gpt5.3chat

qwen3.6p

qwen3.5m

gemma4
Gemini2.5p
所以之前4刚出来的时候,我说聊天体验和上下文检索能力匹敌2.5p 但是知识量这一块还是2.5p作为大模型更强一点~
Gemini3.1flash-lite

3.1pro
7 个帖子 - 3 位参与者