tts - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

tts - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 23 篇相关文章 · 第 1 / 2 页

评价一下雷总送的MiMo Token

速度还可以,功能也还行,多模态、TTS都能用,API也很稳定,并发高一点也不怎么爆错。优点很多,缺点就是消耗的速度太快了,不管是七亿的还是十六亿的,基本上用不了几天就不够用了,再加上没缓存、Pro的倍率翻倍,薅完之后就是不太想续费(对我而言) 6 个帖子 - 6 位参与者 阅读完

tech linux.do 2026-04-30 16:42:30+08:00

[分享创造] [开源] OpenTalking:整合 LLM、流式 TTS 与 WebRTC 的实时数字人编排框架

[开源] OpenTalking:面向实时对话的开源数字人产线 (LLM+TTS+WebRTC) V 站的各位开发者朋友们大家好!今天想和大家分享我们开源的一个新项目: OpenTalking 。这是一个开源的实时数字人框架。 开发数字人对话产品时,大家往往会遇到一个痛点:各种优

tech v2ex.com 2026-04-30 12:13:22+08:00

[分享创造] [开源] OpenTalking:整合 LLM、流式 TTS 与 WebRTC 的实时数字人编排框架

[开源] OpenTalking:面向实时对话的开源数字人产线 (LLM+TTS+WebRTC) V 站的各位开发者朋友们大家好!今天想和大家分享我们开源的一个新项目: OpenTalking 。这是一个开源的实时数字人框架。 开发数字人对话产品时,大家往往会遇到一个痛点:各种优

tech v2ex.com 2026-04-30 12:13:22+08:00

测试下MIMO的TTS,好像效果还挺不错的

感谢雷子哥送的token plan,llm放在hermes上还没怎么深度测试,刚好趁着限免简单测试了一下TTS系列模型,效果还是很理想的,尤其是voice clone感觉生成速度很快,效果也不错 放出前端页面: MIMO-tts-test ,大家也可以用用看 github地址:

tech linux.do 2026-04-29 16:15:59+08:00

Vibe 了一个赛博女友,我是说,赛博聊天对象。

前景提要: 4.25 的 openclaw 对 tts 做了很大更新,原生支持了 xiaomi。 试用了一下 tts 功能,依然不尽如人意,相信大家都知道和 openclaw 都聊些啥,现在的大部分模型,回复啰里八嗦。完全不可能有 tts on 的想法。所以玩了一下就搁置了。 今

tech linux.do 2026-04-28 19:05:26+08:00

哪家中转站有asr和tts

如题,想用豆包的ASR模型,但是需要企业认证以及充值不是很灵活,后台做的太难用了,所以想从中转站接,哪个中转站有? 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-27 11:47:04+08:00

[deepseek 网页增强脚本 V3] 支持调用远程 MCP + 支持 tts 语音!

更新:参考佬友们的意见,增加了远程 MCP 调用、tts 语音等功能,可以使用免费的微软接口,也可以自定义 openai 兼容接口 效果: 使用建议 在“自动朗读”的时候关闭 MCP 工具调用,否则会朗读无关内容 在需要朗读时可以通过另一个脚本注入提示词:不要使用 emoji、颜

tech linux.do 2026-04-26 20:28:25+08:00

注射型“卫星肝”可能为肝脏移植提供替代方案

MIT News | Massachusetts Institute of Technology Injectable “satellite livers” could offer an alternative to liver... MIT engineers develope

tech linux.do 2026-04-25 22:50:31+08:00

【开源】TTS-Vue-Next 文本转语音工具

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-04-24 12:56:12+08:00

MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现

小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现 - IT之家 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 10:11:14+08:00

小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现

IT之家 4 月 24 日消息,小米今日正式发布 MiMo-V2.5-TTS Series 与 MiMo-V2.5-ASR —— 一套面向 Agent 时代的全链路语音模型系列, 覆盖识别与合成两大核心能力 ,让语音的输入与输出都可以被语言自由调度。 IT之家从官方介绍获悉,Mi

tech www.ithome.com 2026-04-24 07:34:22+08:00

新型电驱动人造肌肉纤维

MIT News | Massachusetts Institute of Technology A new type of electrically driven artificial muscle fiber New electrofluidic artificial mus

tech linux.do 2026-04-23 21:05:46+08:00

英语App单词发音实现疑问

最近想开发一款英语学习的App,但是对单词发音实现有点疑问。 原本打算用系统的TTS,发现效果好差,机械音太重(另外苹果Siri这种用的系统TTS吗 感觉没有机械音,还是我使用方式不对?)。 网上搜了一圈,发现还有很多使用有道的Api(疑似逆向,官方渠道未找到对接方式)因为担心不

tech linux.do 2026-04-22 11:07:10+08:00

[问与答] 有什么优惠的 TTS(适合有声书)订阅方案么?

有请彦祖

tech v2ex.com 2026-04-21 23:17:59+08:00

[问与答] 有什么优惠的 TTS(适合有声书)订阅方案么?

有请彦祖

tech v2ex.com 2026-04-21 22:23:04+08:00

[问与答] 有什么优惠的 TTS(适合有声书)订阅方案么?

有请彦祖

tech v2ex.com 2026-04-21 20:45:56+08:00

将人工智能驱动的蛋白质设计工具带给全球生物学家

MIT News | Massachusetts Institute of Technology Bringing AI-driven protein-design tools to biologists everywhere OpenProtein.AI is helping

tech linux.do 2026-04-20 16:22:00+08:00

AI学习博客资料

会使用ai能调用各家的能用来干活,能搞音频,视频,tts这些,但是觉得还是一个api组装师傅,哪位推荐一下系统的那种ai知识从小白开始普及的那种博客 ,循序渐进那种最好是 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-19 18:17:57+08:00

抖音上面的解说类视频配音用的都是什么TTS?感觉有很多标准模板

经常刷抖音能刷到一些比较熟悉的声音,最近刷到了很多我常听的播客的那种非大众的语音,但是感觉用的人也非常非常多。比如说有一个三五环的播客,刘飞的声音我就听到过好多次。有佬友知道这个是怎么做的吗? 2 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-18 01:19:24+08:00

人人都能是配音导演,阶跃星辰发布语音生成模型 StepAudio 2.5 TTS

IT之家 4 月 16 日消息,阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS ,官方号称人人都能是配音导演。 阶跃星辰官方表示,该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context(全局语境)+ Inline Conte

tech www.ithome.com 2026-04-16 15:33:43+08:00