数据挖掘与分析实战:聚类、分布、降维与异常检测
1. 聚类方法入门
1.1 k-means 三簇聚类
在进行 k-means 三簇聚类时,我们可以按照以下步骤操作:
1. 加载 Iris 数据集到变量 iris_data 中:
iris_data<-iris
- 创建
t_color列,默认值设为红色,将两种物种的颜色分别改为绿色和蓝色,使第三种保持红色:
iris_data$t_color='red'
iris_data$t_color[which(iris_data$Species=='setosa')]<-'green'
iris_data$t_color[which(iris_data$Species=='virginica')]<-'blue'
- 随机选择三个簇中心:
k1<-c(7,3)
k2<-c(5,3)
k3<-c(6,2.5)
- 绘制散点图,以萼片长度和萼片宽度为坐标,并设置颜色:
plot(iris_data$Sepal.Length,ir
超级会员免费看
订阅专栏 解锁全文
339

被折叠的 条评论
为什么被折叠?



