应用岭回归的场景有很多。
本文介绍的是 在应用多元线性回归时 遇到多重共线性问题,且无法删除变量或者增加样本量的情况下,应用岭回归的情况。
- 案例:互联网经济对中国经济增长影响
- 基础模型:C-D生产函数:Y=A*L^α *K^β
- 应用模型:岭回归
- 使用工具:r语言
- 使用程序包:‘MASS’、‘xlsx’、‘car’
- 准备数据:Y:国民生产总值、K:固定资产投资;L:年期末就业人数;A:互联网综合发展水平
- 数据处理:为了模型的稳定性与计算的简易性,分别对两端取对数,变成线性关系,得到最终模型:lnY=γlnA+αlnL+βlnk
- 变量解释与结果推测:综合考虑互联网经济的指标体系和数据的可得性,采用因子分析的方法估计综合技术水平A(详情可点击)。γ、α、β表示互联网经济产出弹性系数、劳动力弹性和资本弹性系数,本文推测,生产弹性系数会符合以下估计:
(1)α+β+γ>1,表示最终经济规模呈递增趋势;
(2)α<1、β<1,表示边际收益递减的规律性,γ>1,表示互联网经济的边际收益递增性,符合互联网经济的特征。
对数线性化与多重共线性判别
#加载程序包与数据
library(MASS)
library(xlsx)
library(car)
y <- read.xlsx("D:/RData/sets/Y.xlsx",1,encoding = "UTF-8")
l <- read.xlsx("D:/RData/sets/L.xlsx",1,encoding = "UTF-8")
a <- read.xlsx("D:/RData/sets/A.xlsx",1,encoding = "UTF-8")
k <-</