Clustering by fast search and find of density peaks
文章来源
发表在science上
网址:http://www.sciencemag.org/content/344/6191/1492.short两个观点
- 密度观点:聚类中心点的密度比临近点密度都大
- 距离观点:聚类中心与比他们密度更大的点的距离都比较大
观点图示
Fig A:点的分布,并且已经按照密度排序。
Fig B:密度值和距离值的二维图
召回方案
- 密度观点召回:召回了密度中心和靠近密度中心的点。
- 距离观点召回:召回了离群点和密度中心点。
- 密度召回∩距离召回:召回密度中心点
计算方法
密度值
距离值
综合指标
- 可以合并两个指标,作为最终指标
- 例如:𝛾=𝜌*𝛿
复杂度
- 时间复杂度:
O(m*n^2) - 空间复杂度:
O(m*n^2)
- 时间复杂度:
一些聚类算法的比较
- No Free Lunch: 没有最好的聚类方法,只有最合适的。
- No Free Lunch: 没有最好的聚类方法,只有最合适的。
和dbscan比较
- 当有渐变噪声的时候,dbscan很难找到合适的密度,去聚出这两个类,但是本算法可以
- 当有渐变噪声的时候,dbscan很难找到合适的密度,去聚出这两个类,但是本算法可以