[推广] windows 离线语音转文本、语音转文本、实时字幕工具

编辑部 2026-05-04T12:24:25.193763 30964 阅读 tech

功能亮点完全本地推理与存储，不依赖网络不依赖 GPU ，CPU 速度飞快功能介绍 CPU 飞快 i5-11400H：30min 的音频 1min 就能处理完（五年前的 CPU ） i5-4210m：30min 的音频 3min 就能处理完（十年前的 CPU ）实时识别支持识别麦克风、系统声...

功能亮点

CPU 飞快
推荐阅读
clawemail天才程序员陨落

推荐阅读
这些 GPT Free 号是废了吗
1. i5-11400H：30min 的音频 1min 就能处理完（五年前的 CPU ）
2. i5-4210m：30min 的音频 3min 就能处理完（十年前的 CPU ）
实时识别
1. 支持识别麦克风、系统声音或者双路同时识别。
2. 支持字幕和语音输入模式，支持同步翻译（通过自部署 LLM 模型，推荐 HY - MT1.5-1.8B ，速度极快）
识别音视频文件
1. 支持主流音视频文件。
2. 内置 FFMpeg 处理，可以转换各种格式。
说话人管理
1. 内置说话人管理
2. 可以为每个说话人指定模型进行识别
强大的编辑与搜索功能
1. 支持自定义词典。自动调用词典内容进行后处理。
2. 支持手动编辑，点击识别文本自动跳转到对应音频。
3. 支持批量删除与替换
4. 支持全局搜索
本地 LLM 支持
1. 内置 ollama 接口，支持一键启动，一键处理。
2. 可以自定义提示词，使用本地部署的 LLM 模型进行润色、翻译、总结等任务
语言支持
1. 普通话（ 97%）、中文方言（ 90%）、英语（ 95%）、韩语、日语以及意大利语（ 97%）、西班牙语（ 96%）、葡萄牙语（ 95%）、德语（ 95%）、法语（ 95%）、俄语（ 94%）、乌克兰语（ 93%）、波兰语（ 93%）、荷兰语（ 93%）等 25 种欧洲语言

来源: v2ex.com查看原文

推广 windows 离线语音文本一个帖子现在