我其实想要的是:大模型 语音转文字 的效果。
之前把录音mp3传给Gemini,转出来的文字效果很棒,能把我的磕绊、思考、嗯嗯啊啊什么的都去掉。往往转出来就是最终可用的版本了。
讯飞等产品,说完之后还要再精修,因为有很多嘴瓢的内容都被转录下来了。 ![]()
大家有没有满足这样需求的语音输入法推荐呢?有多端最好,主要Win和Ios用。
或者大家觉得开发一个这样的输入法有没有说法。
整体思路挺简单的,就是录音+多模态大模型API,甚至还能指定大模型,有没有搞头 ![]()
14 个帖子 - 8 位参与者
我其实想要的是:大模型 语音转文字 的效果。
之前把录音mp3传给Gemini,转出来的文字效果很棒,能把我的磕绊、思考、嗯嗯啊啊什么的都去掉。往往转出来就是最终可用的版本了。
讯飞等产品,说完之后还要再精修,因为有很多嘴瓢的内容都被转录下来了。 ![]()
大家有没有满足这样需求的语音输入法推荐呢?有多端最好,主要Win和Ios用。
或者大家觉得开发一个这样的输入法有没有说法。
整体思路挺简单的,就是录音+多模态大模型API,甚至还能指定大模型,有没有搞头 ![]()
14 个帖子 - 8 位参与者
首先安装powershell7,可以直接在 微软应用商店 搜索安装,这样能自动更新不需要手动配置。 如何在 Window...
根据我这么多年看番的经验,发现有一些番剧它前面几集节奏会比较缓慢。然后突然某一集会有一个爆点,突然吸引住我。 从这一集之...
以后折叠屏安卓可以做不少事情了。 远程桌面到刷系统,代替现有轻薄笔记本的部分功能。 加上一线通,处理本地的部分工作,娱乐...
不小心升级了codex cli,结果没法用了。报错说不支持Chat Completions协议,有啥转换软件么? 1 个...
先上链接: 国区 AppStore 链接 非国区 AppStore 链接 官网 本人是 Beancount 多年用户,虽...
本地的flux.dev,搞着搞着,就要审查了,然后不出图; qwen的3.6倒是下载了,但因为是量化版本的,总是不好使,...
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · zz-tg-cn.com.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.gxsczb.com
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.gxzztoubiao.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.dianyoupg.com
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn
延展页面 · www.tcti.cn