一、Logistic回归模型
线性回归模型要求因变量是连续型正态变量。当因变量是分类变量时,Logistic回归模型是最好的回归模型。
由于y只能取两个值1或0,y的条件数学期望:
E(y|xi)=1*p(y=1|xi)+0*p(y=0|xi)=p(y=1|xi)
选择一个函数,p(y=1|x)=f(x)=Logistic函数,作为回归方程。即利用观测数据(xi,yi)拟合一个Logistic函数。
根据Logistic函数的定义
p=p(y=1|x)=exp(a+b*x)/(1+exp(a+b*x)),这里p/(1-p)=exp(a+b*x)。

Logistic回归模型是处理分类变量的首选模型,适用于因变量只能取两个值的情况。模型利用Logistic函数进行拟合,通过极大似然估计方法求解参数。回归系数反映自变量对因变量的影响。拟合优度检验如皮尔逊x2检验用于评估模型的准确性。流行的数据分析平台如SAS、SPSS和Weka等在数据挖掘中广泛应用。
最低0.47元/天 解锁文章
958

被折叠的 条评论
为什么被折叠?



