首页
/
综合 / 虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难…
虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背
编辑部
2026-05-05T17:29:42.198637
40276 阅读 综合
我看的一部漫画部分章节缺少汉化,于是我vibe开发了一个翻译插件,让多模态大模型翻译和嵌字。 gemini-3.1-flash-lite-preview 效果就已经足够好了,刚领了Mimo的赛博鸡蛋,拿来试一试,结果完全不可用,即便是 mimo-v2.5-pro 。 目测Mimo的问题有: 指令遵循...
虽然Gemini降智降成美国豆包了,但是多模态能力国产还是难以望其项背
我看的一部漫画部分章节缺少汉化,于是我vibe开发了一个翻译插件,让多模态大模型翻译和嵌字。
gemini-3.1-flash-lite-preview效果就已经足够好了,刚领了Mimo的赛博鸡蛋,拿来试一试,结果完全不可用,即便是mimo-v2.5-pro。
目测Mimo的问题有:
- 指令遵循不够好,必须显式地传入结构化输出参数,才会输出符合要求的JSON对象;
- 日语不好,总是漏翻、错翻;
- 不知道从哪里产生的幻觉,常常根据画面脑补不存在的内容,贴一些虎狼之词;
- 嵌字位置精度差。
2 个帖子 - 2 位参与者
阅读完整话题