刚刷到 Google 悄悄上线了 Gemini Omni 。试玩了一个小时,最直观的感受就是:它终于懂“人话”了。
以往的模型生成文字总是扭曲的,Omni 居然能精准还原我要求的 UI 界面文字。对于做产品 Demo 或短视频广告的朋友来说,这绝对是效率神器。
实测了几个点,大家可以对照着看:
[旅行] 计划 6 月初去港澳旅游,第一次去又不想去人特别多的地方,有没有攻略推荐~
[Claude] Antigravity 频繁 Loading 无响应,重装无效但换设备正常,如何解决?
黑板/公式: 还原度确实如 Demo 所示,逻辑是连贯的,不再是乱码。
画面质感: 原生多模态的连贯性很强,尤其是光影调节非常自然。
实时微调: 对话式修改视频里的物体,这种交互确实是未来的方向。 gemini omni 趁现在还没开始大规模收费/排队,各位 V 友快去占座体验一下。