【开源】一个桌面端基于语音识别的AI视频总结工具

编辑部 2026-05-20T08:07:16.780642 46649 阅读 tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社...

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：

以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出

github.com

AI video summarizer and knowledge base for Bilibili, YouTube and local videos.

与众不同的是，因为大学要看很多视频来自学，所以重点关注在知识总结以及思维导图这一方面，下面是一些图：

一开始的目标其实是本地工作流程的，所以可以使用CPU或者CUDA来进行视频文本的转写，不过因为游戏本风扇太吵了，后面选择使用硅基流动的免费的语音转写，发现效果也挺不错（硅基流动免费模型王朝了）

所以现在默认推荐使用在线语音转文字模型，本地的模型环境也可一键安装

视频多了之后知识库的含金量就上来了，我自己试着问一些高数题目也可以链接到对应的视频知识点，方便复习

项目还在不停的迭代，目前重点优化了Windows桌面端应用，也可以用docker部署web端，希望对各位佬友有所帮助！

1 个帖子 - 1 位参与者

来源: LinuxDo 最新话题查看原文

开源一个桌面基于语音 AI 帖子分享

相关推荐