首先是手指数量识别测试,模型可以准确识别6指,但是不能识别4指


与此同时,Gemini 3.1 Pro两项通过

然后是军机型号识别


与此同时,Gemini 3.1 Pro两项通过


都辨认出了Z10的毫米波雷达
冷门航空知识


都没有识别成功,同时也没有出现幻觉
BTW,这是2015年俄罗斯公布的PAK-TA运输机概念图,另外Minimax对于这幅图像出现了幻觉
地图笑话

DS完美的回答出了新西兰和南极洲,与此同时Gemini 3.1 Pro给出了相当令人疑惑的回答,鉴定为严重幻觉



显然,英国、直布罗陀、台湾、巴新等一系列Gemini指出缺失的地方在图上都是存在的
图片联想能力


BTW,Kimi K2.5无法通过这个测试,但是K2.6可以
开盒能力,和上面同一张图片


有朋友反馈说Claude也可以认出
2 个帖子 - 2 位参与者