万能的佬友们,有什么方法自动化读取Excel,pdf 中的数据呀

最近的工作是想办法自动化批量从下载的各地的统计年鉴pdf Excel中读取想要的板块数据,然后按照要求的字段提取出来 ,尝试用codex写python脚本实现但是效果都不好,主要每个地区年鉴格式不一样,表头、单位、年份、地区行都不统一,然后字段口径容易混,基本都是AI coding 出来的 不知道怎...
万能的佬友们,有什么方法自动化读取Excel,pdf 中的数据呀
万能的佬友们,有什么方法自动化读取Excel,pdf 中的数据呀

最近的工作是想办法自动化批量从下载的各地的统计年鉴pdf Excel中读取想要的板块数据,然后按照要求的字段提取出来 ,尝试用codex写python脚本实现但是效果都不好,主要每个地区年鉴格式不一样,表头、单位、年份、地区行都不统一,然后字段口径容易混,基本都是AI coding 出来的 不知道怎么推进了 因为让codex改来改去都有新的bug :smiling_face_with_tear:

image
需要提取的内容如这样 落表应该像这样
image

9 个帖子 - 7 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文