今天给chatgpt，gemini，deepseek，小米喂了一张比较长的图

编辑部 2026-05-04T11:12:19.697738 28158 阅读 tech

只有deepseek识别出来图片信息，而其余根本不知道在说什么。薅到了小米的羊毛，配置在Claude code中让agent切分图片然后OCR识别，结果又不知道在说什么。好奇怪是因为超长图，内容密度很高且包含大量表格和特殊符号，对OCR和视觉模型的分辨率/上下文窗口都是很大挑战吗？ 1 个帖子...

只有deepseek识别出来图片信息，而其余根本不知道在说什么。
薅到了小米的羊毛，配置在Claude code中让agent切分图片然后OCR识别，结果又不知道在说什么。
好奇怪
是因为超长图，内容密度很高且包含大量表格和特殊符号，对OCR和视觉模型的分辨率/上下文窗口都是很大挑战吗？

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文

今天给chatgpt，gemini，deepseek，小米喂了一张比较长的图

[ETF] 趁大 A 放假，恒科大涨 3%

求助毕业文章降低ai方法

相关推荐