怎么把图片类pdf题库(很多手机拍照图片)整理为前端的html题库

如题,求助各位佬。 我最近想把我们学校的各个专业的收集的题库整理为html的代码放到网站上,不过因为手里的题库除了doc还好说一些,其他的好多那种同学们手机拍照的图片,直接ocr可能会丢很多格式和表格,图示什么的 试过用claw做这个任务,但是总感觉太费token了,就比如我这有一个扫描出来的180...
怎么把图片类pdf题库(很多手机拍照图片)整理为前端的html题库
怎么把图片类pdf题库(很多手机拍照图片)整理为前端的html题库

如题,求助各位佬。
我最近想把我们学校的各个专业的收集的题库整理为html的代码放到网站上,不过因为手里的题库除了doc还好说一些,其他的好多那种同学们手机拍照的图片,直接ocr可能会丢很多格式和表格,图示什么的
试过用claw做这个任务,但是总感觉太费token了,就比如我这有一个扫描出来的180页的雅思题库,如果纯用大模型读的话必须得拆分开了,感觉有点大材小用ww,昨天处理了25个pdf就花了70M了
求求各位佬给些好的建议ww

image
image

2 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文