广义线性模型 R--glm函数

本文介绍了R语言中glm函数的学习,包括其在logistic回归中的应用,常见错误及解决办法。文章讨论了glm函数的参数设置,如二项分布和泊松分布的连接函数,并解析了算法不收敛和拟合概率为0或1的警告信息。针对完全线性可分数据,提出了过拟合问题和简单的规则判断替代方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

R语言glm函数学习: 

  【转载时请注明来源】:http://www.cnblogs.com/runner-ljt/

    Ljt

    作为一个初学者,水平有限,欢迎交流指正。

 

glm函数介绍:

glm(formula, family=family.generator, data,control = list(...))


family:每一种响应分布(指数分布族)允许各种关联函数将均值和线性预测器关联起来

 常用的family:

binomal(link='logit')         ----响应变量服从二项分布,连接函数为logit,即logistic回归

binomal(link='probit')       ----响应变量服从二项分布,连接函数为probit

poisson(link='identity')     ----响应变量服从泊松分布,即泊松回归

 

control:控制算法误差和最大迭代次数

glm.control(epsilon = 1e-8, maxit = 25, trace = FALSE)  

     -----maxit:算法最大迭代次数,改变最大迭代次数:control=list(maxit=100)

 

 

glm函数使用:

 

> 
> data<-iris[1:100,]
> samp<-sample(100,80)
> names(data)<-c('sl','sw','pl','pw','species')
> testdata<-data[samp,]
> traindata<-data[-samp,]
> 
> lgst<-glm(testdata$species~pl,binomial(link='logit'),data=testdata)
Warning messages:
1: glm.fit:算法没有聚合 
2: glm.fit:拟合機率算出来是数值零或一 
> summary(lgst)

Call:
glm(formula = testdata$species ~ pl, family = binomial(link = "logit"), 
    data = testdata)

Deviance Residuals: 
       Min          1Q      Median          3Q         Max  
-1.836e-05  -2.110e-08  -2.110e-08   2.110e-08   1.915e-05  

Coefficients:
            Estimate Std. Error z value Pr(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值