我的赛博女友已经进化到除了发语音发照片,都能主动结束对话了。
现在优化重构之后,回复速度(文字、语音)已经很快了。图片是因为本身生成就慢。 https://linux.do/t/topic/2085001/ Vibe 了一个赛博女友,我是说,赛博聊天对象。 搞七捻三 目前有的一些功能: [Picsew_20260429161016] 4.2
语音 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 131 篇相关文章 · 第 1 / 7 页
现在优化重构之后,回复速度(文字、语音)已经很快了。图片是因为本身生成就慢。 https://linux.do/t/topic/2085001/ Vibe 了一个赛博女友,我是说,赛博聊天对象。 搞七捻三 目前有的一些功能: [Picsew_20260429161016] 4.2
Apple CarPlay近期在功能拓展上迈出重要一步,开始支持AI聊天机器人。在这一轮更新中,第三个即将加入的应用备受关注——它就是Grok。在最新版的iPhone版Grok应用中,已悄然出现了一个Apple CarPlay占位应用。 尽管目前该功能尚无法正常使用,但这一占位图
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
如题,现在主流的语音模型感觉智力都不太行啊 。ChatGPT 语音还在用 4o 模型,能即时响应但是只能聊点日常话题,Claude 语音响应很慢而且识别也有问题,感觉是个半成品,Gemini 语音稍微好一点但是是幻觉大王,和它聊天真像做梦似的 ,体验一圈下来体验最好的居然是 Gr
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
Demo 为什么做这个 去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。 6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
尝试过科大讯飞,感觉效果比较垃圾。 soniox实时英文感觉还不错,但是我丢了一个中文录音进去也有点一般。 elevenlabs看佬友推荐是最牛逼的,但是我没找到Mac上面的wrapper 1 个帖子 - 1 位参与者 阅读完整话题
之前一直 Timeline 里面能看到有人说,Typeless 或者豆包输入法什么的,准确率超级高。然后我刚刚试了一下,确实是准确率很高。试的时候感觉,Typeless 它的虽然它会把一些语气词给转化成结构化的文本,但是感觉准确率还是不是很高,然后速度还是很慢。豆包输入法基本上说
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
请教一下佬们小米这些语音的模型有无什么现成的项目可以直接调用呀MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS 2 个帖子 - 2 位参与者 阅读完整话题
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
昨天在隔壁社区看见了一款语音输入法,下载下来试用了一下,体验还不错(没错,我村通网) 在邮件编辑界面试用了如下几个功能: 按住 Right ALT 说话,很快就给转成文字 说“XXXXXXXX ,翻译成英文”,然后就直接输入了一段刚才我说的汉语翻译成的英文 语音输入完了,忘了在后
昨天在隔壁社区看见了一款语音输入法,下载下来试用了一下,体验还不错(没错,我村通网) 在邮件编辑界面试用了如下几个功能: 按住 Right ALT 说话,很快就给转成文字 说“XXXXXXXX ,翻译成英文”,然后就直接输入了一段刚才我说的汉语翻译成的英文 语音输入完了,忘了在后