多元线性回归的适用条件:
(1)自变量对应变量的变化具有显著影响
(2)自变量与应变量间的线性相关必须是真实的,而非形式上的
(3)自变量之间需有一定的互斥性
(4)应具有完整的统计数据
训练数据:csv格式,含有19维特征
数据下载地址:http://pan.baidu.com/s/1eSx1fwe
步骤一:数据读取及预处理
从vt.csv文件中读取训练数据,从
rm(list = ls(all=TRUE))
library(car)
library(corrplot, quietly=TRUE)
library(sqldf)
## 数据读取
folder <- "file:///D:/My Documents/R/"
# 销量分3类读取
name <- "vt.csv"
namepre <- "vp.csv"
path <- paste(folder,name,sep = "");
pathpre <- paste(folder,namepre,sep = "")
# 训练集
dataset <- read.csv(path, na.strings=c(".", "NA", "", "?"), strip.white=TRUE, encoding="UTF-8")
# 预测集
datasetpre <- read.csv(pathpre, na.strings=c(".", "NA", "", "?"), strip.white=TRUE, encoding="UTF-8")
dataselect <- sqldf("select * from datasetpre")
datapre <- dataselect[2:

本文介绍了如何使用R语言进行多元线性回归分析,特别针对自变量间存在的严重共线性问题进行了主成分分析。通过主成分提取,发现仅需2个主成分即可解释大部分数据变异,建立了稳定的回归模型,并进行了模型的显著性检验和残差分析。
最低0.47元/天 解锁文章
2539





