[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video,像聊天一样做视频

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者,我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成,如果不满意往往只能换提示词全部推翻重来。 为了解决这个痛点,我基于 Google 的 Gemini Omni 模型开发了这个对话式视频...
[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video,像聊天一样做视频
[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video,像聊天一样做视频

Gemini Omni Video。作为一个经常需要做短视频和宣发物料的开发者,我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成,如果不满意往往只能换提示词全部推翻重来。

为了解决这个痛点,我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演,通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目,希望能听到各位的反馈。

Gemini Omni Video 简介

简单来说,这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中,你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景,AI 就会为你生成视频。

最重要的是,如果对生成的细节不满意,你可以直接给它下指令,比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图,在保留原有画面的基础上实时重新渲染,而不是瞎猜重做。

Gemini Omni Video 的特点

为了让它真正好用并且能用于生产环境,我在开发时侧重了以下几个核心体验:

  • 拒绝“抽卡”,支持对话式持续迭代: 这是它最大的不同点。系统会保留你的会话上下文,你可以一帧一帧地迭代,调整取景、切换风格、延长时长,甚至替换某个角色,而不会丢失之前做好的部分。就像是视频版的“版本控制”。
  • 多模态输入,统一工作流: 无论你扔给它一段剧本、一张产品图,还是一段语音备忘录,甚至三者同时输入,它都能理解并融合生成一段连贯的视频,省去了手动合成的麻烦。
  • 自带音效与角色一致性: 每次生成的视频都自带同步的音效(环境音、特效声等视觉对齐音频)。此外,它支持跨片段保持人物面部、服装和风格的一致性,非常适合做系列短片。
  • 一键 4K 多格式输出: 描述一次你的视频,就能自动适配并导出 16:9 ( YouTube )、9:16 ( TikTok/Reels )或 1:1 格式的 4K 视频,系统会自动重新构图,无需手动裁剪。所有成片均自带完全的商业使用权。

如何使用?

整个流程非常符合直觉,从白纸到最终成品只需要简单的三步:

  1. 布置舞台: 丢入你的原始素材,比如文本脚本、参考照片或音频剪辑,AI 会自动读取并构建一个统一的创意大纲。
  2. 导演场景: 告诉 AI 你的诉求:摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确,AI 都能智能适应并补全剩余细节。
  3. 持续打磨: 预览视频后,用大白话提出修改意见(如“前奏剪短点”、“放大产品”)。每一轮修改都会保留好的部分并修复瑕疵,满意后直接导出 4K 成片。

使用网址: https://geminiomnivideo.ai

以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布,只需要不到五分钟时间。个人独立开发不易,欢迎大家来试玩体验!如果使用中遇到任何 bug 或者有新的功能建议,请直接在帖子里留言,我会第一时间跟进解答和修复。感谢大家支持!

来源: v2ex查看原文