R实现局部线性回归与核回归

本文介绍了非参数回归中的核估计方法,包括Nadaraya-Watson核估计和局部加权最小二乘估计。通过高斯核函数实现局部线性回归,并通过R语言模拟数据展示了核估计和局部线性估计的曲线,强调了拟合程度受 bandwidth h 和样本量的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一元非参数回归模型:

 

核回归方法估计m(x)

想法:利用x附近的点 xi距离x的远近,对样本观测值yi 进行加权,从而得到xy的值。

定义加权平均核:

Nadaraya-Watson核估计为: 

局部加权最小二乘估计:

 Nadaraya-Watson核估计为(高斯核):

局部线性回归估计m(x)

想法:在局部线性函数回归的基础上核估计虽然实现了局部加权,但这个权重在局部邻域内是常量,但由于加权是基于整个样本点的,因此在边界不够理想。为了避免边界效应,用一个变动的函数取代局部固定的权。 即在x的邻域用线性函数取代yi的平均。

在局部线性函数回归的基础上

 写成矩阵形式:

写成矩阵形式:

​​​​​

求导得到:

 R中模拟数据y=3(x-0.5)^2,代码实现:

library(Matrix)
library(MASS)
#生成数据
p<-1
n<-100
x_var<-runif(n,0,1)
err=rnorm(n,0,0.1)
y=3*(x_var-0.5)^2+err #y=3(x-0.5)^2
plot(x_var,y)
######核估计方法##########
M1<-function(x,h)
{sum(y[1:100]*exp(-0.5*((x_var[1:100]-x)/h)^2)) /sum(exp(-0.5*((x_var[1:100]-x)/h)^2))}
z<-rep(0,100)
x<-seq(min(x_var),max(x_var),length=100)
for(i in 1:n)
{z[i]<-M1(x[i],0.15)}#h=0.15
lines(x,z)  #核估计曲线    
ymean=3*(x-0.5)^2    
lines(x,ymean,col='red')  #真实曲线

######局部线性估计方法##########
#高斯核函数
kernel.gauss<-function(x){
  (1/sqrt(2*pi))*exp(-(x^2)/2)
}
u<-matrix(0,n,n)
hopt=0.15#h的选择
au<-matrix(0,p,n)
w<-matrix(0,n,n)
for(j in 1:n){
  for(i in 1:n)
  {
    u[i,j] =x_var[i]-x[j]#产生xi-x
  }
  W<-diag(kernel.gauss(u[,j]/hopt)/hopt)
  x_curve<-cbind(1,u[,j])#n*p
  #估计β
  beta0<-ginv(t(x_curve)%*%W%*%x_curve)%*%t(x_curve)%*%W%*%y #p*1
  #au的局部线性估计
  I_p<-diag(1,p)
  I<-cbind(I_p,0)
  au[,j]<-I%*%beta0
}
lines(x,au[1,],col='blue') #局部线性估计曲线

对比图为:

 注意拟合程度会受到h的影响和样本量的大小影响

 

线 性回归分析是一种重要的预测方法,目前已经广泛的应用于各种领域,在统 计学中,线性回归模型(Linear Regression Model,LRM)是利用称为线性回归方程的 最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。 在国内的金融市场中,当我们在对市场未来发展情况进行预测时,若能将影响市 场预测对象的主要因素找到,并且能够取得其数量数据,就可以采用线性回归分 析进行预测。它是一种可行的且实用价值很高的常用金融市场预测方法。一般而 言,回归分析模型有多种类型。依据自变量个数不同,可分为简单回归模型和多 元回归模型。在简单回归模型中,自变量只有一个,而在多元回归模型中,自变 量有两个以上。依据自变量和因变量之间的相关关系不同,又可分为线性回归模 型和非线性回归模型。 使用线性回归模型分析属于一般常态分布之数据,可获的理想的分析预测 结果,但是在现实的数据往往隐含了一些极端值之数据,而这些极端值之数据是 研究社会科学的研究者所关注的对象,倘若使用线性回归模型以其平均值的概念 来概括这些极端值,会使得研究结果失真。然而,目前解决极端值之数据之模型, 大多采用(Koenker,1978)的分量回归模型且有许多相关文献可参考,但是分位数 的概念对于一般人而言较陌生,并且分位数回归模型较线性回归模型复杂不易理 解。因此,本书作者潘文超(Pan, 2017)教授在国际 SSCI 期刊” EURASIA Journal of Mathematics Science and Technology Education”第 13 卷第 8 期发表篇名为” A Newer Equal Part Linear Regression Model: A Case Study of the Influence of Educational Input on Gross National Income”,另外提出一种新的回归方法,本书 称之为”等分线性回归模型”(Equal Part Linear Regression Model, EPLRM),做法是将 数据以若干等分方式进行线性回归建模,如此便可以独立观察每一等分的模型趋 势,并且一般线性回归做比较,目前已经有相关文献(Zhong, 2017;Deng, 2017)。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值