虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背

我看的一部漫画部分章节缺少汉化,于是我vibe开发了一个翻译插件,让多模态大模型翻译和嵌字。 gemini-3.1-flash-lite-preview 效果就已经足够好了,刚领了Mimo的赛博鸡蛋,拿来试一试,结果完全不可用,即便是 mimo-v2.5-pro 。 目测Mimo的问题有: 指令遵循...
虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背
虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背

我看的一部漫画部分章节缺少汉化,于是我vibe开发了一个翻译插件,让多模态大模型翻译和嵌字。

gemini-3.1-flash-lite-preview效果就已经足够好了,刚领了Mimo的赛博鸡蛋,拿来试一试,结果完全不可用,即便是mimo-v2.5-pro

目测Mimo的问题有:

  1. 指令遵循不够好,必须显式地传入结构化输出参数,才会输出符合要求的JSON对象;
  2. 日语不好,总是漏翻、错翻;
  3. 不知道从哪里产生的幻觉,常常根据画面脑补不存在的内容,贴一些虎狼之词;
  4. 嵌字位置精度差。

image
image

image
image

2 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文