[Local LLM] 想在本地部署 OCR 服务,解析美团的外卖订单截图,求推荐一个好用的 OCR 模型
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
lm - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第42页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 934 篇相关文章 · 第 42 / 47 页
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又
比如看 dgx spark 这台机子,部署 31B BF16 gemma 这台机子的带宽 273 GB/s 31B 参数 × 2 bytes (BF16) ÷ 273 GB/s = 每个 token 227 ms = 理论最大 4.4 token/s 实际能到 3token/s
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
如题。如果在cc中体验开启: oh-my-claude-code Everything Claude Code GetStuffDone(GSD) OpenSpec … 这会导致上下文很快爆炸…在一个项目里开了个 /init 直接跑了45%的 ConText… 针对这些烧toke
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
做了个多模型中转网关:统一接入 GPT-5.4 / GLM-5 / Kimi-K2.5 。 特性: 多 Key 池化与自动切换 重试 / fallback / 超时控制 基础限流与负载分发 OpenAI 协议兼容(低成本接入) 支持按需扩展模型 定位是作为统一模型入口,偏生产环境
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
这不是一篇"AI 写代码好厉害"的软文。我想分享一个学药的大学生如何在凌晨、对着终端屏幕、用一个叫 /loop 的命令,让 AI 在自己睡觉的时候继续写代码的记录与复盘。 写在前面 我参加的是 2026 年第 19 届中国大学生计算机设计大赛,作品是 NetP
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
佬友们,站内还有稳定支持的GLM5.1的公益站吗? 8 个帖子 - 5 位参与者 阅读完整话题
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又
有大佬用讯飞的吗,这个 GLM-5.1 怎么样 10 个帖子 - 8 位参与者 阅读完整话题
正好在使用codeBuddy CN的免费积分体验GLM5.1,发现模型提示500,网站用量也访问失败了 1 个帖子 - 1 位参与者 阅读完整话题
在使用notebooklm生成ppt的时候经常会出现ppt模糊,有水印,无法编辑的问题,我拜读过各位大佬的方法,有基于MinerU创建的pptx方法(很高级但是我不会用docker和json)也有推荐的网站pdnob(国外支付方式收费),我都摒弃了最后发现国产WPS有转ppt的功
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又
去年 12 月买了智谱的 coding plan ,lite.,一直没怎么用。4 月份智谱说 lite 用户可以用 glm 5.1 了,用了一下感觉不错。 结果可能是用的太猛,已经被封了 2 次了,说是检测多人使用,但肯定只有我一个人用。 第一次解封后,降低了使用频次,结果今天又