多元统计分析之多元线性回归的R语言实现
多元统计分析--multivariate statistical analysis
研究客观事物中多个变量之间相互依赖的统计规律性。或从数学上说, 如果个体的观测数据能表为 P维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统计方法就叫做多元统计分析 。
重要的多元统计分析方法有:多重回归分析、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等。
多元线性回归(普通最小二乘法)
用来确定2个或2个以上变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型,然后进行参数估计,对估计出来的参数进行显著性检验,残差分析,异常点检测,最后确定回归方程进行模型预测。(1)做个简单线性回归热热身
women#使用自带的woman数据集

fit
summary(fit)#展示拟合模型的详细信息

women$weight#列出真值
fitted(fit)#列出拟合模型的预测值

residuals(fit)#列出拟合模型的残差值
coefficients(fit)#列出拟合模型的模型参数
confint(fit)#列出拟合模型参数的置信区间
anova(fit)#生成一个拟合模型的方差分析表,或者比较两个或更多拟合模型的方差分析表

vcov(fit)#列出拟合模型的协方差矩阵

par(mfrow=c(2,2))
plot(fit)

plot(women$height,women$weight,
xlab="Height (in inches)",
ylab="Weight (in pounds)")#生成观测,变量散点图
abline(fit)#给散点图加上拟合曲线

(2)多项式回归
fit2=lm(weight~height+I(height^2),data=women)#I(height^2)表示向预测等式添加一个平方项
summary(fit2)
plot(women$height,women$weight,
xlab="Height (in inches)",
ylab="Weight (in pounds)")
lines(women$height,fitted(fit2))


fit3=lm(weight~height+I(height^2)+I(height^3),data=women)
summary(fit3)
lines(women$height,fitted(fit3),col="red")


#使用car包的scatterplot()函数
install.packages("car")
library(car)
library(carData)
scatterplot(weight~height,data=women,
spread=FALSE,smooth.args=list(lty=2),pch=19,
main="Women Age 30-39",