大家好,最近做了一套本地音频处理 + 伪知识库的应用,想听听大家对开源价值的看法。
这个项目大概做的是:
- 导入音频 / 视频,通过 ASR 模型转录
- 对转录文本做切分、整理、结构化
- 生成一个偏“伪知识库”的索引
它更像是一套完整工作流,而不是单一工具。核心价值在于把音频资料转成可检索、可复用的个人知识资产。
现在纠结的点是:这个项目对本地部署要求比较高。因为强依赖 ASR 等模型,体验比较依赖 GPU 。如果走 API ,成本又不低,我这边估算大概 1 元 / 小时音频,长期用下来并不便宜。
所以我有点犹豫:
- 这种强依赖本地模型和 GPU 的项目,开源对大家还有意义吗?
- 如果很多人没有合适的显卡,项目会不会只能停留在“看起来不错,但跑不起来”?
- 如果我只把工作流、代码结构、模型适配层、数据处理逻辑开源,模型让用户自己选择,这样是否有价值?
- 是否应该同时支持本地模型和 API 模式,哪怕 API 成本较高?
- 对这种项目来说,大家更关心一键部署,还是更关心架构和实现思路?
我目前的想法是,如果开源,会尽量把边界写清楚:
- 本地部署需要一定 GPU
- API 模式可以跑,但成本需要用户自己评估
- 项目重点是音频处理工作流和知识库构建逻辑
- 模型可以替换,不绑定某一个具体供应商
想问问大家:如果你们看到这样的项目,会觉得有参考价值吗?还是说部署门槛太高,开源意义有限? 也欢迎有类似需求的朋友聊聊你们的使用场景