机器学习8：集群

国易

于 2018-12-10 17:56:57 发布

阅读量1.2k

点赞数

分类专栏：王恩达机器学习入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wycgi/article/details/84799997

版权

本文介绍了非监督学习中的K-均值算法，详细阐述了算法过程、优化目标和集群中心点的选择。同时，探讨了降维技术，特别是主成分分析PCA，包括其算法过程、重建维度和选择K值的策略，并提供了PCA在数据压缩和可视化中的应用建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

集群算法

非监督学习
降维

非监督学习

如下图所示，，非监督学习是把相距较近的点划分为K个簇
在这里插入图片描述

具体可以应用于市场分割、社交网络分析、组织计算集群和天文数据分析

K-均值算法

输入：需要划分的集群数量K，以及训练集 $\{x^{(1)},x^{(2)},\dots,x^{(m)}\}$ 。
其中， $x^{(i)}\in R^n$ （不需要 $x_0=1$ ）

算法过程：
随机初始化K个集群中心点 $\mu_1,\mu_2,...,\mu_k\in R^n$ (一般从样本中随机取K个)
Repeat
$for\quad i = 1\quad to\quad m \\ c^(i) = 距离x^{(i)}最近的集群中心的编号（相当于将样本分配到各集群中心点） \\ for\quad k = 1\quad to\quad m \\ \mu_k := 所有归属于该集群中心的样本的均值点 (移动集群中心到均值上)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。