主成分分析与关联规则挖掘:R语言实战
主成分分析(PCA)在R语言中的应用
主成分分析(PCA)是一种常用的数据分析技术,用于从数据中提取知识并减少属性数量。在R语言中,我们可以使用 psych 包中的 msq 数据集进行PCA分析。
数据准备
首先,我们需要安装并加载 psych 包,然后加载 msq 数据集,并提取我们感兴趣的72个属性:
install.packages("psych")
library(psych)
data(msq)
motiv = msq[,1:72]
处理缺失值
在实际数据集中,缺失值是一个常见问题。我们可以通过以下步骤处理:
1. 检查每个属性的缺失值数量:
apply(is.na(motiv),2,sum)
- 发现部分属性(如
anxious、cheerful等)缺失值较多,为避免大幅减少数据集行数,我们选择移除这些属性。首先确定要移除的属性列号:
head(cbind(names(motiv)),5)
ToSuppress = c(5, 15, 37, 38, 66)
names(motiv[
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



