大数据:聚类
下面是我看《大数据—互联网大规模数据挖掘与分布式处理》一书第七章的总结。
1 聚类:促某空间下点形式的有用的概要表示。为了对点进行聚类,需要在该空间下定义一个距离测度。
本文详细介绍了大数据聚类的概念,包括层次聚类、K-均值算法及其优化方法如BFR、CURE和GRGPF算法。还讨论了流聚类和基于Map-Reduce的聚类策略,揭示了处理高维空间和大规模数据的挑战及解决方案。
1 聚类:促某空间下点形式的有用的概要表示。为了对点进行聚类,需要在该空间下定义一个距离测度。
1172
4231
4177

被折叠的 条评论
为什么被折叠?