【开源】一个桌面端基于语音识别的AI视频总结工具

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源】一个桌面端基于语音识别的AI视频总结工具
【开源】一个桌面端基于语音识别的AI视频总结工具
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


市面上挺多视频总结类的产品,但是感觉都不和我心意,很多也没法自己接api,于是自己做了一个ww

github.com

GitHub - lycohana/BiliSum: AI video summarizer and knowledge base for...

AI video summarizer and knowledge base for Bilibili, YouTube and local videos.

与众不同的是,因为大学要看很多视频来自学,所以重点关注在知识总结以及思维导图这一方面,下面是一些图:

主界面视图:

image

视频总结概要:

image

知识笔记:

image

思维导图:

image

高度自定义,不论模型,提示词

一开始的目标其实是本地工作流程的,所以可以使用CPU或者CUDA来进行视频文本的转写,不过因为游戏本风扇太吵了,后面选择使用硅基流动的免费的语音转写,发现效果也挺不错(硅基流动免费模型王朝了)

所以现在默认推荐使用在线语音转文字模型,本地的模型环境也可一键安装

image

(可选模块)RAG知识库以及AI总结

视频多了之后知识库的含金量就上来了,我自己试着问一些高数题目也可以链接到对应的视频知识点,方便复习

image

项目还在不停的迭代,目前重点优化了Windows桌面端应用,也可以用docker部署web端,希望对各位佬友有所帮助!

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文