功能亮点
-
完全本地推理与存储,不依赖网络
-
不依赖 GPU ,CPU 速度飞快
功能介绍
-
CPU 飞快
-
i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )
-
i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )
-
-
实时识别
-
支持识别麦克风、系统声音或者双路同时识别。
-
支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)
-
-
识别音视频文件
-
支持主流音视频文件。
-
内置 FFMpeg 处理,可以转换各种格式。
-
-
说话人管理
-
内置说话人管理
-
可以为每个说话人指定模型进行识别
-
-
强大的编辑与搜索功能
-
支持自定义词典。自动调用词典内容进行后处理。
-
支持手动编辑,点击识别文本自动跳转到对应音频。
-
支持批量删除与替换
-
支持全局搜索
-
-
本地 LLM 支持
-
内置 ollama 接口,支持一键启动,一键处理。
-
可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务
-
-
语言支持
- 普通话( 97%)、中文方言( 90%)、英语( 95%)、韩语、日语以及意大利语( 97%)、西班牙语( 96%)、葡萄牙语( 95%)、德语( 95%)、法语( 95%)、俄语( 94%)、乌克兰语( 93%)、波兰语( 93%)、荷兰语( 93%)等 25 种欧洲语言