谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 AI 修改视频

编辑部 2026-05-20T03:35:55.133680 35319 阅读综合

IT之家 5 月 20 日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。诺贝尔奖获得者、Google DeepMind 负责人哈萨比斯（Demis Hassabis）表示，Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的...

谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 AI 修改视频

IT之家 5 月 20 日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。

诺贝尔奖获得者、Google DeepMind 负责人哈萨比斯（Demis Hassabis）表示，Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。“Omni”意指“全能”，该模型在处理文字、图像、视频、音频等多种模态信息时，展示出前所未有的流畅性与深度。

Gemini Omni 宣称能“从任何输入生成任何输出”，支持对话式编辑，用户可一句话改变视频中的角色、背景等元素。

IT之家从大会获悉，谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash，即日起可在 Gemini App、Google Flow、YouTube Shorts 可用，未来将推 API 服务。

来源: IT之家查看原文

谷歌 Gemini Omni 全能模型一个 AI 帖子