K-means聚类算法-----------机器学习

本文详细介绍了K-means聚类算法,包括其工作原理、步骤、优缺点以及与EM算法的关系。K-means通过迭代寻找使得同一簇内样本到簇中心距离最小的划分,但对初始均值的选择敏感,可能导致不稳定的聚类结果。此外,K值的选择和对非凸数据、异常值的处理也是其挑战。可以通过肘部法则确定最佳聚类数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

k均值算法是我们学习聚类算法的第一种算法,前面我们介绍了聚类任务以及聚类任务的性能度量,但是还没有介绍具体的算法,今天我们从k均值算法开始说起,前面的博文中我们提到了EM算法,其实k均值算法中也带有EM算法的思想,我们一步一步来看。

k均值算法

给定样本集D=\{\textbf{x}_1,\textbf{x}_2,...,\textbf{x}_m\},那么k均值算法是如何将这些样本集划分为k个类别也就是k个簇C=\{C_1,C_2,...,C_k\},任何一种算法想达到某种效果,都需要有一个性能度量来衡量我这个算法最后聚类结果是否使我们满意的,那么这里k均值算法采用的是最小化同一个簇里面样本到簇中心的距离:

其中\boldsymbol{\mu}_{i}=\frac{1}{\left|C_{i}\right|} \sum_{\boldsymbol{x} \in C_{i}} \boldsymbol{x}是簇C_i的均值向量,这个式子直白的理解就是簇内样本围绕簇均值向

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值