mineru为什么ocr出来的markdown默认标题都是h1

paddleocr v1.5对于表格来说,我感觉没有mineru好,但是今天切到mineru,突然发现ocr出来的markdown都是h1的header,mineru模型没有原生能力输出正确的header层级嘛,我查到说支持设置一个llm来配置,但是我感觉很奇怪这样子。不知道佬们还有没有其他的ocr...
mineru为什么ocr出来的markdown默认标题都是h1
mineru为什么ocr出来的markdown默认标题都是h1

paddleocr v1.5对于表格来说,我感觉没有mineru好,但是今天切到mineru,突然发现ocr出来的markdown都是h1的header,mineru模型没有原生能力输出正确的header层级嘛,我查到说支持设置一个llm来配置,但是我感觉很奇怪这样子。不知道佬们还有没有其他的ocr模型推荐,感觉目前这种稍微复杂点的表格貌似识别的都很一般:sob:

CleanShot 2026-05-18 at 18.22.00@2x
CleanShot 2026-05-18 at 18.33.41@2x

ps: 图片里的是公开文档,网上都能下载的

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文