求怎样能够尽可能的加快向量聚类的整体效率

编辑部 2026-05-04T15:06:19.856856 32346 阅读 tech

目前我在做图谱的实体融合，我目前的思路是每次取一个实体为中心向外使用余弦相似度取出阈值大于0.95的所有实体，然后在剩下的实体中再取一个实体，然后一直循环下去，直到完全遍历，中间成簇的所有实体都不放回。现在的问题是，这种按顺序遍历的方式在实体数量很多的时候，整体效率就非常低，我目前的思路是想办法并...

目前我在做图谱的实体融合，我目前的思路是每次取一个实体为中心向外使用余弦相似度取出阈值大于0.95的所有实体，然后在剩下的实体中再取一个实体，然后一直循环下去，直到完全遍历，中间成簇的所有实体都不放回。

现在的问题是，这种按顺序遍历的方式在实体数量很多的时候，整体效率就非常低，我目前的思路是想办法并发，但是这样会带来簇互相重叠的问题，各位大佬有没有比较好的思路

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文

怎样能够尽可能加快向量一个帖子使用

求怎样能够尽可能的加快向量聚类的整体效率

被赛博大善人cloudflare反薅了17.5刀

CodeCrafters 上架了一个小课程 Build your own Claude Code

相关推荐