K-Means algorithms(K-均值)
K-means算是一个很简单的聚类算法,而聚类与决策树、SVM等不同,是一种无监督的学习,所谓无监督学习(Unsupervised learning)是和监督学习相对应的,不同于监督学习,无监督学习所给的训练集是不包含标签的,所有数据集都只包括特征 xi 而没有标签 yi 。
聚类的主要目的就是将这些没有标签的数据分为N个簇(cluster),其主要的应用有市场划分、社交网络分析、天文学中的数据分析等等。
K-Means的描述如下:
先对参数进行说明:
- x(i) 为第 i