问题:
K-均值聚类是无监督学习算法
设数据集,其中
,
。
假设这个数据可以分为
类。
把这个问题模型化:
,
其中代表第
类的聚点(中心点、均值)。
该模型可以用EM算法进行训练:
初始化,
。
E步:固定,最小化
,显然
,
其中。
M步:固定,最小化
,
,
。
直至收敛。
—————————————————————————————————————————————————————
下面介绍一款机器学习软件,便于理解各种机器学习算法,下载完后,解压。
第一步:
双击,进入图形界面。
第二步:在空白处,首先左击几次
然后,右击几次
数据集准备好之后,就开始选择算法,点击菜单栏
中的
比如,我们用欧几里得距离,选择2个分类,然后点击“Cluster”按钮,看结果就可以了,
。
—————————————————————————————————————————————————————
对于K-means算法的实现:
JAVA中Weka,OpenCV,Python中的Scikit-Learn等。
本文介绍了K-均值聚类算法的基本原理及其在无监督学习中的应用,并通过EM算法详细阐述了其训练过程。此外,还提供了一款实用的机器学习软件,帮助读者更好地理解和实践K-均值聚类。
10万+

被折叠的 条评论
为什么被折叠?



