[推广] windows 离线语音转文本、语音转文本、实时字幕工具

功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支持识别麦克风、系统声...
[推广] windows 离线语音转文本、语音转文本、实时字幕工具
[推广] windows 离线语音转文本、语音转文本、实时字幕工具

功能亮点

  • 完全本地推理与存储,不依赖网络

  • 不依赖 GPU ,CPU 速度飞快

功能介绍

  1. CPU 飞快

    1. i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )

    2. i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )

  2. 实时识别

    1. 支持识别麦克风、系统声音或者双路同时识别。

    2. 支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)

  3. 识别音视频文件

    1. 支持主流音视频文件。

    2. 内置 FFMpeg 处理,可以转换各种格式。

  4. 说话人管理

    1. 内置说话人管理

    2. 可以为每个说话人指定模型进行识别

  5. 强大的编辑与搜索功能

    1. 支持自定义词典。自动调用词典内容进行后处理。

    2. 支持手动编辑,点击识别文本自动跳转到对应音频。

    3. 支持批量删除与替换

    4. 支持全局搜索

  6. 本地 LLM 支持

    1. 内置 ollama 接口,支持一键启动,一键处理。

    2. 可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务

  7. 语言支持

    1. 普通话( 97%)、中文方言( 90%)、英语( 95%)、韩语、日语以及意大利语( 97%)、西班牙语( 96%)、葡萄牙语( 95%)、德语( 95%)、法语( 95%)、俄语( 94%)、乌克兰语( 93%)、波兰语( 93%)、荷兰语( 93%)等 25 种欧洲语言

官网

windows 应用商店

完全免费的安卓版本

来源: v2ex.com查看原文