[分享创造] [开源免费] 实时数字人 OpenTalking 项目演示
最近我们把自己做实时数字人过程中的一套工程框架整理了一下,开源出来了,项目叫 OpenTalking 。 Github 传送门是: https://github.com/datascale-ai/opentalking 演示视频: https://www.bilibili.com
实时 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 163 篇相关文章 · 第 1 / 9 页
最近我们把自己做实时数字人过程中的一套工程框架整理了一下,开源出来了,项目叫 OpenTalking 。 Github 传送门是: https://github.com/datascale-ai/opentalking 演示视频: https://www.bilibili.com
第一次开甲骨文服务器,看帖子特别难开,申请了信用卡试试,似乎一次成功了 实时过程: 申请中行visa信用卡,线上申请,线下激活(它这款信用卡限制,必须线下激活) Chrome 隐私模式进入Oracle注册页 注册信息: 邮箱:QQ邮箱 区域:日本东京 手机号:真实86手机号 地址
之前用了一段时间supergrok,搜索体验非常好,实时性也很强。可惜前几周全被封了,不知道现在还有什么渠道能买到supergrok? 1 个帖子 - 1 位参与者 阅读完整话题
通过硬件进行录音,然后我需要在一个界面看到实时的转文字,并基于我预设的提示模板进行总结和建议。 这个实现的技术方案有哪些?接受付费咨询,只要能实现,多少都可以谈 13 个帖子 - 4 位参与者 阅读完整话题
IT之家 5 月 23 日消息,据游戏媒体 Insider Gaming 今天报道,前史克威尔艾尼克斯(SE)商务总监 Jacob Navok 日前表示,他认为老东家并未真正拥抱“实时服务”网游运营模式,导致《最终幻想》等热门 IP 并未成功传递给新一代玩家。 IT之家从原报道获
今天看到 腾讯混元最新翻译模型 测试分数很强,于是马上LM Studio下了7b的模型 接上 陪读蛙 测试,实测翻译效果非常好,跟连ds v4 flash api效果差不多,可以替代了。终于在本地跑了一个有用的模型,开心~ 延迟(m4): 6 个帖子 - 5 位参与者 阅读完整话
最近有实时翻译的项目需求,不知道该选择自己搭建还是选用gpt-oss-120b这样的模型,想问问佬有没有好的想法或者推荐。 我的理想标准是: 1,极快的输出 2,低的成本(因为翻译请求量大) 3,最好输出能不受审查 4,多语种支持 16 个帖子 - 9 位参与者 阅读完整话题
前两天在 V2EX 分享过一次 OpenTalking ,当时主要介绍的是实时数字人完整链路:LLM 、STT 、TTS 、数字人视频驱动、WebRTC 播放、字幕同步和用户打断。 这两天我们又继续往前推进了一版,重点不是单独换某个模型,而是把实时数字人里比较影响体验的工程链路再
其实我在发帖之前也有检索到类似的帖子: 本站能否出个浏览帖子时【关闭或隐藏】最上面的标题的功能嘛 但是使用MOYU主题,体验感不是很好,侧边栏、标题栏都加了层滤镜/遮罩,达到模糊显示效果 如何不动侧边栏、标题栏前提下,摸鱼时随着浏览帖子自动关闭/隐藏 我看隔壁V站是固定标题,随着
例如gpt的realtime?但是感觉有点贵啊。主要的要求是实时的转化和翻译 5 个帖子 - 4 位参与者 阅读完整话题
IT之家 5 月 20 日消息,据通义实验室消息,通义千问团队发布了 Qwen3.5-LiveTranslate-Flash 实时语音翻译模型,该模型在语种覆盖、延迟控制和音色保留等方面实现显著突破,旨在解决跨境直播、跨国会议等场景中的实时同传痛点。 IT之家附官方详细介绍如下:
之前有推荐的,但是都不能用了,现在页面 403 了,应该是被微信投诉下架了。主要是想让ai 每天帮我看看有没有遗漏的重要消息和群消息总结。 2 个帖子 - 2 位参与者 阅读完整话题
在 2026 年Google I/O 大会上,Google公布了其智能手表平台下一代系统 Wear OS 7 的详细信息。借助此次更新,用户今后可以在手腕上实时查看快递进度、体育比赛比分等动态信息,并在一定程度上提升手表的电池续航表现。 Wear OS 7 引入了类似 iPhon
给的链接都是错的,都不知道怎么体验 omni.chat.ai 3 个帖子 - 3 位参与者 阅读完整话题
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌携手三星公司, 展示了由 Gentle Monster 与 Warby Parker 共同参与设计的 2 款智能眼镜。 定位方面,两款智能眼镜作为手机的伴侣设备存在,重点整合 Gemini AI
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌 CEO 桑达尔 · 皮查伊(Sundar Pichai)预告全新功能 Android Halo, 目标是提升手机端 AI 助手的透明度。 这项功能在 Google I/O 期间亮相,会在屏幕顶部
前几天在 V2EX 分享过一次 OpenTalking ,当时主要介绍的是“一张图片生成可对话角色”的玩法: https://www.v2ex.com/t/1209898#reply5 。 这几天我们又做了一版优化, 适配了更多的模型。目前支持 wav2lip 以及后处理流程、m
前几天在 V2EX 分享过一次 OpenTalking ,当时主要介绍的是“一张图片生成可对话角色”的玩法: https://www.v2ex.com/t/1209898#reply5 。 这几天我们又做了一版优化, 适配了更多的模型。目前支持 wav2lip 以及后处理流程、m
前几天在 V2EX 分享过一次 OpenTalking ,当时主要介绍的是“一张图片生成可对话角色”的玩法: https://www.v2ex.com/t/1209898#reply5 。 这几天我们又做了一版优化, 适配了更多的模型。目前支持 wav2lip 以及后处理流程、m
大家好,做了一个小工具来解决自己日常看币价的痛点,之前首发的时候在 v 站 我的第一个 macos APP:实时加密货币价格查看 上宣传过一次,送了一部分免费激活码。 本周限时免费,限免理由很简单:结婚纪念日。 基于上次的介绍,更新了不少新功能。 适配 macOS Liquid