看到一位佬友的帖子,下面有人需求动作影片的字幕方案,为了不影响原帖的解答,我就另开一个帖子了。
最近自己下了几个日语音声,想生成srt文件然后翻译一下。结果发现各种方案都有一定问题: 1、直接拿工具提取了纯净人声,然后用buzz,加载whisper large V3去生成字幕,基本还好,但是经常在没声音的地方乱加字幕,以及有时候字幕所对应时间集体错位。 2、下了qwen-asr 1.7B,识别能力不错,但是自带的字幕时间轴功能及其拉跨,几分钟的音频几个字就当一句音频,有的几百毫秒有的十几…
其实方案早就有了,使用下面这个项目将日语转为英文字幕,可以在项目里配置大模型翻译也可以手动贴到别的应用翻译,接下来就是享受的时间~
github.com
GitHub - meizhong986/WhisperJAV: ASR/STT subtitle generator. Uses Qwen3-ASR, local...
ASR/STT subtitle generator. Uses Qwen3-ASR, local LLM, Whisper, TEN-VAD. Noise-robust for JAV
至于效果我只能说包你一用一个不吱声 ![]()
4 个帖子 - 3 位参与者