请问有没有用前置ocr模型，给非多模态模型提供视觉能力的方案呢

编辑部 2026-05-04T12:18:31.283196 42988 阅读 tech

最新的DeepSeek又便宜又好（主要是便宜），想把大部分工作转移到DeepSeek上了但偶尔还会有传图片的需求，这时候手动切换一下模型怪麻烦的，有没有办法给ai做一个前置判断，识别到有图片，就调用一下多模态的模型，然后输出文字化的图片内容给DeepSeek的无感的方案呢 4 个帖子 - 4 ...

最新的DeepSeek又便宜又好（主要是便宜），想把大部分工作转移到DeepSeek上了

但偶尔还会有传图片的需求，这时候手动切换一下模型怪麻烦的，有没有办法给ai做一个前置判断，识别到有图片，就调用一下多模态的模型，然后输出文字化的图片内容给DeepSeek的无感的方案呢

4 个帖子 - 4 位参与者

阅读完整话题

来源: linux.do查看原文

请问有没有前置 ocr 模型一个帖子现在

请问有没有用前置ocr模型，给非多模态模型提供视觉能力的方案呢

clawemail天才程序员陨落

这些 GPT Free 号是废了吗

相关推荐