让AI分析总结视频是否可行?

兄弟们,我有一个奇怪的想法,那就是我想用 AI 去分析总结 B 站的视频 前情提要:B 站有很多优秀的 UP 主,他们可能发了上千个视频。很多是那种直播的切片啊之类的,都是知识技巧分享。 我觉得他们的视频质量都挺高的,所以想要让ai分析提取出来,整理成md文档,这样方便我检索,省的看视频了。 不知道...
让AI分析总结视频是否可行?
让AI分析总结视频是否可行?

兄弟们,我有一个奇怪的想法,那就是我想用 AI 去分析总结 B 站的视频

前情提要:B 站有很多优秀的 UP 主,他们可能发了上千个视频。很多是那种直播的切片啊之类的,都是知识技巧分享。

我觉得他们的视频质量都挺高的,所以想要让ai分析提取出来,整理成md文档,这样方便我检索,省的看视频了。

不知道大家有没有这样的感觉,有很多 UP 主实际上是有一些干货的,但是他们说话特别啰嗦,会有各种客套和注水。

我现在想要做的,就是让 AI 把这些注水的内容都去掉,直接帮我总结出比较精华的内容。这样的话,一个 10 分钟的视频,我通过看 MD 文档,可能 2 分钟就看完了。

整理成 MD 文档还有一个好处,那就是可以让 AI 再次帮我总结,做成那个 Wiki 文档那种形式的。

但是现在有个问题,就是我不知道具体该怎么处理这些视频。

首先,视频我都可以直接下载到本地。GitHub 上有各种开源工具,B 站的视频都能下载下来,不需要担心风控或 Cookie 之类的问题。我可以手动把视频先存到本地,然后再让 AI 去分析。

硬件方面,我有一张 5090 显卡,使用comfyui之类的,显存什么的我觉得应该够用。但现在的问题就是,我不知道具体该怎么去操作这件事。

之前还有一些方案是直接提取音频信息,做成类似于语音识别的形式,把视频里的音频识别出来,或者直接下载识别好的字幕之类的,然后再让 AI 去总结。

但是我觉得这种方案好像没有直接总结视频的效果好。我不知道现在这种传统的、或者说比较常见的方案具体是什么样子的,你们有人研究过吗?

15 个帖子 - 13 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文