1.K-means的原理
1.1聚类分析的基本思想
先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下任何一个:
(1) 没有(或最小数目)对象被重新分配给不同的聚类。
(2)没有(或最小数目)聚类中心再发生变化。
(3)误差平方和局部最小。
1.2聚类分析的目的
聚类分析目的在于将相似的事物归类,同一类中的个体有较大的相似性,不同类的个体差异性很大。
2.聚类实现
2011年全国31省,直辖市,自治区等的衣食住行。进行聚类分析。
R语言代码:
#均值聚类
library("factoextra")
library("ggplot2")
data <- read.table("clipboard