[分享创造] [开源] 只需一张图片，助你打破次元壁，实现和任何想聊天的角色对话，支持音色复刻、角色预设

编辑部 2026-05-04T13:34:05.280198 48115 阅读 tech

大家好！ gpt image 2 的生图效果已经可以以假乱真，基于图片，我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址： https://github.com/datascale-ai/opentalking Ope...

[分享创造] [开源] 只需一张图片，助你打破次元壁，实现和任何想聊天的角色对话，支持音色复刻、角色预设

大家好！ gpt image 2 的生图效果已经可以以假乱真，基于图片，我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址： https://github.com/datascale-ai/opentalking

OpenTalking 默认 avatar 模型是 flashtalk ，为了帮助大家快速体验，整条链路只需要本地部署一个模型服务（ FlashTalk WebSocket ）； LLM 、STT 、TTS 全部走阿里云百炼 API （ OpenAI 兼容端点 + DashScope 实时 ASR/TTS ），也可无痛切换为自己启动或者 OmniRT 部署的自定义模型服务。完整安装说明、模型权重下载和分布式部署见 docs/quickstart.md 、docs/deployment.md 和 docs/hardware.md 。

开箱即用的实时链路：从 LLM 回复、流式 TTS ，到字幕事件、状态事件和 WebRTC 播放，全部在一条链路中完成。

话不多说，上图 OWO：

（炉石酒馆鲍勃） https://i.imgur.com/GWDcF9t.png

（初音未来 Miku ） https://i.imgur.com/MtgAwSK.png

项目基于 Apache License 2.0 协议开源，欢迎大家来跑一跑，提提 Issue 或者 PR ！

来源: v2ex.com查看原文

分享创造开源一张图片一个帖子现在

[分享创造] [开源] 只需一张图片，助你打破次元壁，实现和任何想聊天的角色对话，支持音色复刻、角色预设

西门子将向罗马尼亚交付东欧首批氢能动车组，预计 2029 年投运

[分享创造] 我开发了一款滑动消除的游戏，请各位斧正，我来改进

相关推荐