[问与答] 关于我做了一个自嗨的语音助手,愿景是小白也能通过自然语言轻松操控电脑或手机(跪求大佬指点)
因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体 这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味
语音 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第6页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 132 篇相关文章 · 第 6 / 7 页
因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体 这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味
特斯拉中国车机语音大模型服务已于 4 月 20 日完成备案,车机语音服务将接入豆包大模型。此前特斯拉中国官网披露,Model Y L 将搭载豆包大模型和 DeepSeek 模型,均通过火山引擎接入。 其中,豆包大模型主要负责语音命令,包括导航设定、媒体播放控制、空调调节和车主手册
上海市新增一款已完成备案的生成式人工智能服务——特斯拉车机语音大模型服务。 对此,特斯拉方面人士回应称:“敬请期待。”按照规定,已上线的生成式人工智能应用应在显著位置或产品详情页面公示所使用已备案生成式人工智能服务情况,注明模型名称及备案号,并根据《人工智能生成合成内容标识办法》
IT之家 4 月 22 日消息,科技媒体 macobserver 今天(4 月 22 日)发布博文,报道称在最新 TestFlight 测试 iOS 版 Chrome 浏览器中, 谷歌扩展支持快捷指令(Shortcuts),并深度集成 Siri 体验。 IT之家援引博文介绍,在现
IT之家 4 月 22 日消息,网信上海 4 月 21 日发布了生成式人工智能服务已备案信息公告:截至 4 月 21 日,上海市新增 1 款已完成备案的生成式人工智能服务, 累计已完成 158 款生成式人工智能服务备案 。 备案信息显示, 特斯拉车机语音大模型服务于 4 月 20
IT之家 4 月 21 日消息,京东京造现已推出一款云宁 AI 语音驱蚊风扇,该风扇集成驱蚊仓,支持 AI 离线语音控制功能,同时接入了小米米家 App,定价为 189 元, 首发价为 159 元 。 京东 京东京造 云宁驱蚊电风扇 159.元 直达链接 该风扇提供 4 档体感系
IT之家 4 月 21 日消息,大众中国首席技术官托马斯・乌尔布里希在接受外媒 CNBC 采访时表示,大众汽车将从今年下半年起为中国市场车型引入语音人工智能控制系统,用户可通过语音指令操控车辆各项功能。 托马斯・乌尔布里希表示,大众车载 AI 助手将整合腾讯、阿里巴巴、百度等企业
德国汽车巨头大众汽车宣布,将为中国市场车型搭载语音人工智能控制系统。大众周二表示,自今年下半年起,基于大众中国车载系统打造的所有车型,均将配备智能语音 AI 助手,用户可通过语音指令操控车辆各项功能。 2026 年 4 月 8 日,中国北京,大众品牌之夜活动上展出的 ID.Aur
最近发现 mac 上语音输入的软件不少, 识别率也挺高的, 想买个有线麦克风来试试, 有佬友可以推荐平价的有线麦克风, 想试试水 10 个帖子 - 1 位参与者 阅读完整话题
IT之家 4 月 21 日消息,据 Pushsquare 报道,部分 PlayStation 5 玩家突然陆续收到了年龄验证通知。截至IT之家撰稿时,该通知仅面向英国和爱尔兰地区的玩家。 通知内容显示,为“遵守全球相关法规”,若用户希望继续使用本世代主机的文字消息、语音聊天等社交
说明:字母、数字前后空格是语音转文字形成的,AI 生成内容已截图。 好早以前就想弄这个了,苦 CPA 前端已久(当然还是感谢为主,已经是很好的平台,只是个人的需求侧重有一点点不同),尤其是那个额度查询。 我感觉就是这个,我一直都挺想更方便查的,但好像也不是那么频繁地需要查询,比如
MiniMax 语音:让灵感声声悦耳 试试我生成的两个: www.minimaxi.com/audio MiniMax 语音和音乐 用MiniMax Speech2.6与Music 2.0模型,生成高度逼真的人声与音乐 www.minimaxi.com/audio MiniMax
IT之家 4 月 20 日消息,4 月 20 日(今天)下午,阿里通义实验室正式推出语音识别大模型 Fun-ASR1.5。 其基于统一的大模型架构,单模型即可 覆盖 30 种语言、汉语七大方言体系及 20+ 地方口音 ,古诗词吟诵也能精准转写。目前,Fun-ASR1.5 已在阿里
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
我从25年5月使用语音笔记到现在快一年了 在L站写了十倍速写作系列11篇文章 6月一个月录音80万字 现在每月录音20万字左右 用过大部分的语音输入法:豆包,Spokenly,VoiceInk,SuperWhisper,LazyTyper,Typeless,WhisperFlow
看到一位佬友的帖子,下面有人需求动作影片的字幕方案,为了不影响原帖的解答,我就另开一个帖子了。 朋友们,有什么比较好的声音(日语为主)转字幕方案吗? 搞七捻三 最近自己下了几个日语音声,想生成srt文件然后翻译一下。结果发现各种方案都有一定问题: 1、直接拿工具提取了纯净人声,然
最近自己下了几个日语音声,想生成srt文件然后翻译一下。结果发现各种方案都有一定问题: 1、直接拿工具提取了纯净人声,然后用buzz,加载whisper large V3去生成字幕,基本还好,但是经常在没声音的地方乱加字幕,以及有时候字幕所对应时间集体错位。 2、下了qwen-a
求语音转文字软件,可以识别讲话人,可以指定AI领域名词识别的(因为是一个学术会议,可能专业名词比较多 ) 3 个帖子 - 3 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
IT之家 4 月 16 日消息,此前专注于文字内容的语言人工智能企业 DeepL 德国当地时间今日宣布推出专为实时口语交流设计的实时翻译产品套件 DeepL Voice-to-Voice。 DeepL Voice-to-Voice 套件包括 Voice for Meetings