求助!!有没有什么方法可以很好的处理类似于这种PDF中的复杂表格的数据提取

如图所示,我现在的工作是做一个自动化工具将类似于这种复杂表格中的信息按照公司内部的数据结构要求规范的提取出来 我目前的做法是:定义好结构要求,接入Gemini的API去自动识别,但是对于大批量工作,成本偏高,而且准确率不是太好 佬们有没有更好的办法 13 个帖子 - 9 位参与者 阅读完整话题...
求助!!有没有什么方法可以很好的处理类似于这种PDF中的复杂表格的数据提取
求助!!有没有什么方法可以很好的处理类似于这种PDF中的复杂表格的数据提取

image
如图所示,我现在的工作是做一个自动化工具将类似于这种复杂表格中的信息按照公司内部的数据结构要求规范的提取出来

我目前的做法是:定义好结构要求,接入Gemini的API去自动识别,但是对于大批量工作,成本偏高,而且准确率不是太好

佬们有没有更好的办法

13 个帖子 - 9 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文