昨天突然有个需求pdf转markdown,之前是基于minerU,因为目前有个别的项目用到了paddleocr所以想共用一个。
需求如下:pdf转markdown,然后把图片传minio,替换markdown的图片标签的url。可选开启多模态分析图片,把分析结果传入markdown的图片标签[ ]里。要求使用paddleocr-vl-1.5(已基于VLLM部署)和任意多模态模型(已部署)。 基于fastapi提供对外接口
我本人没用过paddleocr。就把相关文档和需求给到提示词。
[推广] 免费送奖品价值超万元:程序员 VIbe Coding 最佳搭子,行走式编程最佳形态!
[推广] 免费送奖品价值超万元:程序员 VIbe Coding 最佳搭子,行走式编程最佳形态!
刚开始使用codex(pro掉了,用的88中转的GPT5.5)plan模式聊了几句感觉不是那回事。
就给augment充了20刀。效果真不错,一下子就击中了我的点。 That’s exactly what I wanted.
3 个帖子 - 3 位参与者