主成分分析与关联分析:数据挖掘的实用技巧
在数据挖掘领域,主成分分析(PCA)和关联分析是两种强大的技术。主成分分析可用于降维和理解高度相关变量的数据集,而关联分析则广泛应用于推荐系统、产品摆放和促销定价等多个领域。下面将详细介绍这两种技术的应用过程。
主成分分析(PCA)
主成分分析是一种无监督学习技术,可用于减少数据集的维度,同时保留大部分信息。以下是使用PCA进行士兵体重预测的详细步骤:
1. 数据加载与审查
首先,加载必要的R包,并读取数据:
library(magrittr)
install.packages("caret")
install.packages("DataExplorer")
install.packages("earth")
install.packages("ggthemes")
install.packages("psych")
install.packages("tidyverse")
options(scipen = 999)
army_ansur <- readRDS("army_ansur.RData")
查看部分特征名称:
colnames(army_ansur)
分析 Component 和 Gender 列的分布情况:
table(army_ansur$Com
超级会员免费看
订阅专栏 解锁全文
624

被折叠的 条评论
为什么被折叠?



