请问有没有用前置ocr模型,给非多模态模型提供视觉能力的方案呢 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

请问有没有用前置ocr模型,给非多模态模型提供视觉能力的方案呢 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 1 篇相关文章

请问有没有用前置ocr模型,给非多模态模型提供视觉能力的方案呢

最新的DeepSeek又便宜又好(主要是便宜),想把大部分工作转移到DeepSeek上了 但偶尔还会有传图片的需求,这时候手动切换一下模型怪麻烦的,有没有办法给ai做一个前置判断,识别到有图片,就调用一下多模态的模型,然后输出文字化的图片内容给DeepSeek的 无感的 方案呢

tech linux.do 2026-04-28 13:15:02+08:00