数据处理与分析的实用方法
在数据处理与分析领域,有多种方法和技术可用于聚类、概率分布分析、降维、数据比较以及异常检测等任务。下面将详细介绍这些方法的具体实现和应用。
1. 聚类方法
1.1 k-means 聚类(三个簇)
k-means 聚类是一种常用的无监督学习算法,用于将数据点划分为不同的簇。以下是使用 k-means 对鸢尾花数据集进行三个簇聚类的步骤:
1. 加载鸢尾花数据集:
iris_data<-iris
- 创建颜色列并设置默认值,然后根据物种修改颜色:
iris_data$t_color='red'
iris_data$t_color[which(iris_data$Species=='setosa')]<-'green'
iris_data$t_color[which(iris_data$Species=='virginica')]<-'blue'
- 选择三个随机簇中心:
k1<-c(7,3)
k2<-c(5,3)
k3<-c(6,2.5)
- 绘制散点图:
plot(iris_data
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



