最近做了一个很小的在线音频工具:AI Vocal Remover 。
它没有想做成很重的音频工作台,当前主要围绕一条短流程:
- 上传一个本地音频文件。
- 等 AI 做 vocal separation 。
- 在浏览器里分别预览 vocal 和 instrumental 两个 stem 。
- 判断结果是否可用。
- 下载需要的 MP3 输出。
我做这个时比较在意的是“预览”这一步。很多去人声工具会把重点放在处理完成,但对真实使用来说,处理完成不等于值得保存。比如练歌的人更关心伴奏是否够干净,剪辑或复盘的人可能更关心人声 stem 是否能单独听清。
所以我没有把文案写成“完美去人声”之类的承诺,而是让用户先听两个结果,再决定要不要下载。
边界也先说清楚:分离质量会受曲目、混音、源音频质量以及模型和第三方处理服务影响;用户也应该只上传自己有权处理的音频。
想听听 V2EX 上做工具和做音频相关东西的朋友两个意见:
- 对这类工具来说,先预览 vocal / instrumental 再下载 MP3/WAV ,这个流程是不是够直接?
- 页面上应该更突出“可做什么”,还是更早说明“分离效果会因音源而变化”?
链接: https://ai-vocal-remover.com/