[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

编辑部 2026-06-07T05:12:46.853952 14469 阅读 tech

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者，我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成，如果不满意往往只能换提示词全部推翻重来。为了解决这个痛点，我基于 Google 的 Gemini Omni 模型开发了这个对话式视频...

[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

Gemini Omni Video。作为一个经常需要做短视频和宣发物料的开发者，我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成，如果不满意往往只能换提示词全部推翻重来。

为了解决这个痛点，我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演，通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目，希望能听到各位的反馈。

Gemini Omni Video 简介

简单来说，这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中，你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景，AI 就会为你生成视频。

最重要的是，如果对生成的细节不满意，你可以直接给它下指令，比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图，在保留原有画面的基础上实时重新渲染，而不是瞎猜重做。

Gemini Omni Video 的特点

为了让它真正好用并且能用于生产环境，我在开发时侧重了以下几个核心体验：

拒绝“抽卡”，支持对话式持续迭代： 这是它最大的不同点。系统会保留你的会话上下文，你可以一帧一帧地迭代，调整取景、切换风格、延长时长，甚至替换某个角色，而不会丢失之前做好的部分。就像是视频版的“版本控制”。
多模态输入，统一工作流： 无论你扔给它一段剧本、一张产品图，还是一段语音备忘录，甚至三者同时输入，它都能理解并融合生成一段连贯的视频，省去了手动合成的麻烦。
自带音效与角色一致性： 每次生成的视频都自带同步的音效（环境音、特效声等视觉对齐音频）。此外，它支持跨片段保持人物面部、服装和风格的一致性，非常适合做系列短片。
一键 4K 多格式输出： 描述一次你的视频，就能自动适配并导出 16:9 （ YouTube ）、9:16 （ TikTok/Reels ）或 1:1 格式的 4K 视频，系统会自动重新构图，无需手动裁剪。所有成片均自带完全的商业使用权。

如何使用？

整个流程非常符合直觉，从白纸到最终成品只需要简单的三步：

布置舞台： 丢入你的原始素材，比如文本脚本、参考照片或音频剪辑，AI 会自动读取并构建一个统一的创意大纲。
导演场景： 告诉 AI 你的诉求：摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确，AI 都能智能适应并补全剩余细节。
持续打磨： 预览视频后，用大白话提出修改意见（如“前奏剪短点”、“放大产品”）。每一轮修改都会保留好的部分并修复瑕疵，满意后直接导出 4K 成片。

使用网址： https://geminiomnivideo.ai

以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布，只需要不到五分钟时间。个人独立开发不易，欢迎大家来试玩体验！如果使用中遇到任何 bug 或者有新的功能建议，请直接在帖子里留言，我会第一时间跟进解答和修复。感谢大家支持！

来源: v2ex查看原文

推广一个对话 AI 视频帖子参与者 IT

[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

Gemini Omni Video 简介

公开一个自用很久的实卡平台吧

我的claude MAX难道是假的吗，跑了62M Token 就 28%了...

Gemini Omni Video 的特点

如何使用？

相关推荐