我做了个象棋界面ocr对比,提示词为“从象棋截图中,获取棋盘布局,也就是把所有的棋子坐标用ucci格式保存下来”。正确答案中部分B和E都是象,H和N都表示马。正确答案为
# 逐子坐标(中文)
红炮 a9
黑将 e9
黑士 f9
黑士 e8
红马 c7
黑炮 d7
黑卒 i3
黑马 d2
红帅 e1
红仕 f0
红相 g0
position fen C3ka3/4a4/2Nc5/9/9/9/8p/3n5/4K4/5AB2 w - - 0 1
结果只有gemini完全正确,gpt5.5识别错了两个颜色。mimov2.5棋子位置错误一个,错了三个颜色。deepseek完全懵逼,位置错误,颜色错误,意图错误。
10 个帖子 - 6 位参与者