关于低分辨率的试卷修复.

感觉很难一次成型,直接用GPT-IMAGE-2,只要图片小+文字多,到最后一堆幻觉,最终成图和原试卷相差甚远. 后来前置套了一层BANANA2,似乎好那么一点了.中文文字没有GPT-IMAGE-2好,但是模型幻觉低啊. 不过BANANA2对低分辨率的图片输入,还是不太友好,会有各种奇怪问题. 只能再...
关于低分辨率的试卷修复.
关于低分辨率的试卷修复.

感觉很难一次成型,直接用GPT-IMAGE-2,只要图片小+文字多,到最后一堆幻觉,最终成图和原试卷相差甚远.
后来前置套了一层BANANA2,似乎好那么一点了.中文文字没有GPT-IMAGE-2好,但是模型幻觉低啊.
不过BANANA2对低分辨率的图片输入,还是不太友好,会有各种奇怪问题.
只能再套一次字节的SEEDVR2放大模型(偶然间发现一个很逆天的图片文字恢复工具)

3次流式处理下来,终于稍稍满意了,真的难.

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文