【上架官方商店】图片翻译助手--利用多模态生成模型来翻译图片并回填

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【上架官方商店】图片翻译助手--利用多模态生成模型来翻译图片并回填
【上架官方商店】图片翻译助手--利用多模态生成模型来翻译图片并回填
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


图片翻译扩展:用自己的 API 做高质量图片翻译

一个用于网页图片翻译的浏览器扩展。

之前商店里一直没有特别合适的图片翻译扩展,就算有,很多也是按点数收费。
现在可用的大模型 API 渠道越来越多,与其买点数,不如直接接入自己的 API,所以就有了这个扩展。

目前已经上架 Chrome 官方商店,安装和更新都更方便了。


安装与源码

入口 地址 Chrome 商店 点击安装扩展 GitHub 源码 llm-image-translator
翻译效果 翻译前后对比

主要用途

这个扩展主要用来补全 沉浸式翻译阅读蛙 等工具在图片翻译方面的缺失。

虽然用大模型做图片翻译有点"杀鸡用牛刀",但实际效果相当不错,尤其适合:

  • 网页中的说明图
  • 产品页图片
  • 教程截图
  • 文档配图
  • 带文字的信息图

图片翻译示例

支持排除图片和网站

不想翻译的图片或者网站可以手动排除,避免不必要的 API 消耗。

image


已测试可用的 API / 模型

目前测试可用的有:

  • 反重力转小香蕉 2
  • Qwen Image 2 官方 API
  • xAI 官方 API
    旧版模型文字效果一般
  • grok2api
  • Seedream 5 官方 API

理论上,只要接口兼容,所有 API 都可以支持。


关于漫画翻译

暂时不推荐用于漫画翻译。

目前试下来的效果还没有特别满意,大多数模型会偏直译,对语气、分镜上下文和人物口吻的处理还不够自然。

豆包的效果倒是不错,但目前似乎不太方便转成 API 使用。

5 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文