【十二】K-Means算法

最新推荐文章于 2024-03-02 09:34:58 发布

原创

最新推荐文章于 2024-03-02 09:34:58 发布 · 625 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习教程

K均值聚类算法 The K-Means Clustering Algorithm

在前面的课程我们已经介绍过监督学习算法，现在我们开始介绍非监督学习算法，首先我们将介绍一种很典型的非监督学习算法，K-Means聚类算法。

聚类算法可用于解决这一问题：给定一个训练集{x1, x2, ..., xm}，我们希望将其分为k个不同的类，但我们事先并不知道训练集中的某一元素应分到哪一类中。聚类算法中常用的有K均值算法，这一算法的执行过程如下：

在上述算法中，参数k表示我们希望的分类数，参数μj表明我们当前对第j类中心位置的预测。在初始过程中，我们可以随机的选取k个点作为类中心，当然也可以有其他的选择方法。它的循环过程包括两步：（1）将待分类的点分配给距离最近的类；（2）将类的中心移动到这一类所有点的中心。

一个典型的K均值算法执行过程如下，我们选择类数k=2

在K均值算法中，我们定义失真函数Distortion Function为，失真函数的物理意义为训练集中的元素和类中心的集合距离的平方和，这一函数类似于我们之前介绍的损耗函数。

我们执行算法的过程类似于之前介绍过的坐标上升法，我们分别固定c和μ取得极值，因此函数必定单调下降，一定会收敛，但由于这一函数是非凸的函数，其很可能收敛于一个局部最优解而非全局最优解。一般而言K均值算法会取得很好的效果，我们也可以多次使用这一算法以保证结果的准确性。<

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。