1. 数据准备
首先,我们需要一个数据集。为了简化,我将使用MASS
包中的mvrnorm
函数来生成一个多元正态分布的模拟数据集。
# 加载MASS包
library(MASS)
# 设置随机数种子以便结果可复现
set.seed(123)
# 生成多元正态分布的数据集
n <- 50 # 观测值数量
p <- 2 # 变量数量
Sigma <- matrix(c(1, 0.5, 0.5, 1), nrow = 2) # 协方差矩阵
mu <- c(0, 0) # 均值向量
data <- mvrnorm(n, mu, Sigma)
# 转换为数据框以便查看
data <- as.data.frame(data)
names(data) <- c("X1", "X2")
head(data)
2. 多元均值检验
如果我们想检验整个均值向量(而不是单个变量的均值),通常我们会使用Hotelling’s T²检验。但是,R中没有直接提供这个函数。不过,我们可以使用psych
包中的manova.test
函数来进行多元方差分析(MANOVA),这实际上是对均值向量的检验。
# 安装和加载psych包(如果尚未安装)
if (!require(psych)) install.packages("psych")
library(psych)
# 假设我们有一个分组变量group,这里我们随机生成一个
data$group <- factor(sample(c("