[开源自荐] PaperBanana-CN:一个中文友好、中转站友好的科研生图工具

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
[开源自荐] PaperBanana-CN:一个中文友好、中转站友好的科研生图工具
[开源自荐] PaperBanana-CN:一个中文友好、中转站友好的科研生图工具
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


可直接用自己的大模型URL和API进行生图,界面汉化,使用友好方便!

最近我自己做论文图、方法图的时候,经常会拿大模型先跑几版草图找思路。

但用下来很烦的问题是很多开源科研生图项目默认绑定官方 Gemini / OpenAI,要么绑定死,无法配置,要么想用自己的中转站很麻烦。

尤其是 gpt-image-2 出来之后,我发现不少项目还没跟上。最后实在受不了,就基于 PaperBanana / PaperBanana-Pro 改了一版更适合中文用户和中转站用户的版本。

简单说就是你有自己的大模型 URL 和 API Key,就可以直接在网页里填进去实现科研生图。

常用场景:
VLM 用一个便宜/稳定的模型负责理解论文内容和规划图,生图单独接 gpt-image-2 或 Nanobanana。这样不用强行绑死在一个平台,哪个中转站好,哪个模型效果好就用哪个。

目前的坑:
如果提示词特别长,gpt-image-2 通过部分中转站生图时可能会遇到超时、CF 盾、接口不稳定之类的问题。这个更多是服务链路问题,项目本身只能尽量加长超时和减少不兼容参数。

项目地址:PaperBanana-CN

欢迎 star,欢迎提 issue.

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文