augmentcode确实厉害。

昨天突然有个需求pdf转markdown,之前是基于minerU,因为目前有个别的项目用到了paddleocr所以想共用一个。 需求如下:pdf转markdown,然后把图片传minio,替换markdown的图片标签的url。可选开启多模态分析图片,把分析结果传入markdown的图片标签 [ ]...
augmentcode确实厉害。
augmentcode确实厉害。

昨天突然有个需求pdf转markdown,之前是基于minerU,因为目前有个别的项目用到了paddleocr所以想共用一个。

需求如下:pdf转markdown,然后把图片传minio,替换markdown的图片标签的url。可选开启多模态分析图片,把分析结果传入markdown的图片标签[ ]里。要求使用paddleocr-vl-1.5(已基于VLLM部署)和任意多模态模型(已部署)。 基于fastapi提供对外接口

我本人没用过paddleocr。就把相关文档和需求给到提示词。

刚开始使用codex(pro掉了,用的88中转的GPT5.5)plan模式聊了几句感觉不是那回事。

就给augment充了20刀。效果真不错,一下子就击中了我的点。 That’s exactly what I wanted.

image

3 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文