一种用于聚类的常用算法,相较于Kmeans,优点有:
无需事先指定聚类组数
对噪声不敏感
对原始数据集的分布要求低
缺点:
数据量较大时处理速度慢
原理详解:
http://shiyanjun.cn/archives/1288.html
初级使用方法(主要是调参):
http://www.cnblogs.com/pinard/p/6217852.html
以上链接也给出了一种比较典型的不太适合使用k-means进行聚类的数据集分布情况
http://blog.youkuaiyun.com/sandyzhs/article/details/46773731
Python实现:
http://www.cnblogs.com/wsine/p/5180778.html
C++实现:
http://blog.youkuaiyun.com/k76853/article/details/50440182

本文介绍了一种常用的聚类算法DBSCAN,并对比了它与K-means算法的不同之处。DBSCAN的优点包括无需预设聚类数量、对噪声数据不敏感及对数据分布的要求较低。文章还探讨了该算法存在的不足,例如在处理大规模数据集时速度较慢,并提供了多个实用链接资源,包括算法原理详解、初级使用方法和Python/C++实现。
458

被折叠的 条评论
为什么被折叠?



