求怎样能够尽可能的加快向量聚类的整体效率

目前我在做图谱的实体融合,我目前的思路是每次取一个实体为中心向外使用余弦相似度取出阈值大于0.95的所有实体,然后在剩下的实体中再取一个实体,然后一直循环下去,直到完全遍历,中间成簇的所有实体都不放回。 现在的问题是,这种按顺序遍历的方式在实体数量很多的时候,整体效率就非常低,我目前的思路是想办法并...
求怎样能够尽可能的加快向量聚类的整体效率
求怎样能够尽可能的加快向量聚类的整体效率

目前我在做图谱的实体融合,我目前的思路是每次取一个实体为中心向外使用余弦相似度取出阈值大于0.95的所有实体,然后在剩下的实体中再取一个实体,然后一直循环下去,直到完全遍历,中间成簇的所有实体都不放回。

现在的问题是,这种按顺序遍历的方式在实体数量很多的时候,整体效率就非常低,我目前的思路是想办法并发,但是这样会带来簇互相重叠的问题,各位大佬有没有比较好的思路

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文