向量知识库还是 grep 搜索

最近看到一些文章,说 claude code 在相对于以前的一些工具,选择了 grep 搜索而非进行建立向量,grep 搜索效果更好。 然后现在在做一个知识库系统,并非这种代码智能体。其中知识库中就会有很多 docx,pdf,ppt,扫描件之类的,是否有必要考虑,通过 mineru 之类的工具,将它...
向量知识库还是 grep 搜索
向量知识库还是 grep 搜索

最近看到一些文章,说 claude code 在相对于以前的一些工具,选择了 grep 搜索而非进行建立向量,grep 搜索效果更好。

然后现在在做一个知识库系统,并非这种代码智能体。其中知识库中就会有很多 docx,pdf,ppt,扫描件之类的,是否有必要考虑,通过 mineru 之类的工具,将它们转化为 markdown,来给 agent 进行全文搜索,而不使用传统的向量知识库呢?

21 个帖子 - 10 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文