评价一下雷总送的MiMo Token
速度还可以,功能也还行,多模态、TTS都能用,API也很稳定,并发高一点也不怎么爆错。优点很多,缺点就是消耗的速度太快了,不管是七亿的还是十六亿的,基本上用不了几天就不够用了,再加上没缓存、Pro的倍率翻倍,薅完之后就是不太想续费(对我而言) 6 个帖子 - 6 位参与者 阅读完
TTS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 23 篇相关文章 · 第 1 / 2 页
速度还可以,功能也还行,多模态、TTS都能用,API也很稳定,并发高一点也不怎么爆错。优点很多,缺点就是消耗的速度太快了,不管是七亿的还是十六亿的,基本上用不了几天就不够用了,再加上没缓存、Pro的倍率翻倍,薅完之后就是不太想续费(对我而言) 6 个帖子 - 6 位参与者 阅读完
[开源] OpenTalking:面向实时对话的开源数字人产线 (LLM+TTS+WebRTC) V 站的各位开发者朋友们大家好!今天想和大家分享我们开源的一个新项目: OpenTalking 。这是一个开源的实时数字人框架。 开发数字人对话产品时,大家往往会遇到一个痛点:各种优
[开源] OpenTalking:面向实时对话的开源数字人产线 (LLM+TTS+WebRTC) V 站的各位开发者朋友们大家好!今天想和大家分享我们开源的一个新项目: OpenTalking 。这是一个开源的实时数字人框架。 开发数字人对话产品时,大家往往会遇到一个痛点:各种优
感谢雷子哥送的token plan,llm放在hermes上还没怎么深度测试,刚好趁着限免简单测试了一下TTS系列模型,效果还是很理想的,尤其是voice clone感觉生成速度很快,效果也不错 放出前端页面: MIMO-tts-test ,大家也可以用用看 github地址:
前景提要: 4.25 的 openclaw 对 tts 做了很大更新,原生支持了 xiaomi。 试用了一下 tts 功能,依然不尽如人意,相信大家都知道和 openclaw 都聊些啥,现在的大部分模型,回复啰里八嗦。完全不可能有 tts on 的想法。所以玩了一下就搁置了。 今
如题,想用豆包的ASR模型,但是需要企业认证以及充值不是很灵活,后台做的太难用了,所以想从中转站接,哪个中转站有? 1 个帖子 - 1 位参与者 阅读完整话题
更新:参考佬友们的意见,增加了远程 MCP 调用、tts 语音等功能,可以使用免费的微软接口,也可以自定义 openai 兼容接口 效果: 使用建议 在“自动朗读”的时候关闭 MCP 工具调用,否则会朗读无关内容 在需要朗读时可以通过另一个脚本注入提示词:不要使用 emoji、颜
MIT News | Massachusetts Institute of Technology Injectable “satellite livers” could offer an alternative to liver... MIT engineers develope
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现 - IT之家 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 4 月 24 日消息,小米今日正式发布 MiMo-V2.5-TTS Series 与 MiMo-V2.5-ASR —— 一套面向 Agent 时代的全链路语音模型系列, 覆盖识别与合成两大核心能力 ,让语音的输入与输出都可以被语言自由调度。 IT之家从官方介绍获悉,Mi
MIT News | Massachusetts Institute of Technology A new type of electrically driven artificial muscle fiber New electrofluidic artificial mus
最近想开发一款英语学习的App,但是对单词发音实现有点疑问。 原本打算用系统的TTS,发现效果好差,机械音太重(另外苹果Siri这种用的系统TTS吗 感觉没有机械音,还是我使用方式不对?)。 网上搜了一圈,发现还有很多使用有道的Api(疑似逆向,官方渠道未找到对接方式)因为担心不
有请彦祖
有请彦祖
有请彦祖
MIT News | Massachusetts Institute of Technology Bringing AI-driven protein-design tools to biologists everywhere OpenProtein.AI is helping
会使用ai能调用各家的能用来干活,能搞音频,视频,tts这些,但是觉得还是一个api组装师傅,哪位推荐一下系统的那种ai知识从小白开始普及的那种博客 ,循序渐进那种最好是 1 个帖子 - 1 位参与者 阅读完整话题
经常刷抖音能刷到一些比较熟悉的声音,最近刷到了很多我常听的播客的那种非大众的语音,但是感觉用的人也非常非常多。比如说有一个三五环的播客,刘飞的声音我就听到过好多次。有佬友知道这个是怎么做的吗? 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 16 日消息,阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS ,官方号称人人都能是配音导演。 阶跃星辰官方表示,该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context(全局语境)+ Inline Conte