数据科学与大数据分析学习笔记-5聚类

最新推荐文章于 2022-09-01 14:33:20 发布

Jifu_M

最新推荐文章于 2022-09-01 14:33:20 发布

阅读量703

点赞数

分类专栏：数据科学与大数据分析文章标签：大数据聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Jifu_M/article/details/111825913

版权

Clustering聚类

聚类是指通过无监督（unsupervised）技术对相似的数据对象进行分组形成簇。

K-means Clustering

给定m个对象的集合每个对象都有n个可测量的属性。
分四步：

Choose the value of k, and the k initial guess for the centroids
选定 k 值，以及 k 个质心的初始猜测值。
Compute the distance from each data point to each centroid. Assign each point to the closest centroid.
计算从每个数据点(xi ,yi )到每个质心的距离，然后每个点分配给最近的质心。所有分配
给同一个质心的点组成一个簇。一共形成 k 个簇,使用欧几里得距离来测量。
Update the centroid of each cluster to become the center of gravity of the cluster.
算步骤 2 中新形成定义的每一个簇的质量中心，即新质心。

其中center of gravity是

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。