R语言主成分分析(PCA):从数据中提取关键信息
主成分分析(Principal Component Analysis,简称PCA)是一种常用的统计分析方法,用于降低数据维度并提取关键信息。通过PCA,我们可以从高维数据中找到较低维度的线性组合,这些组合能够最大程度地保留原始数据的方差。本文将介绍如何使用R语言进行PCA,并提供相应的源代码。
在R语言中,我们可以使用prcomp()
函数进行主成分分析。下面是一个完整的示例代码,演示了如何使用R进行PCA分析:
# 载入需要的包
library(ggplot2)
# 创建一个包含多个变量的数据集
data <- data.frame(
x1 = c(1, 2, 3, 4, 5),
x2 = c(2, 4, 6, 8, 10),
x3 = c(3, 6, 9, 12, 15)
)
# 执行主成分分析
pca_result <- prcomp(data, scale. = TRUE)
# 输出主成分分析的结果
print(pca_result)
# 提取主成分分析的结果
eigenvectors <- pca_result$rotation
eigenvalues <- pca_result$sdev^2
# 计算贡献率
variance_explained <- eigenvalues / sum(eigenvalues)
#