一、Logistic回归模型
线性回归模型要求因变量是连续型正态变量。当因变量是分类变量时,Logistic回归模型是最好的回归模型。
由于y只能取两个值1或0,y的条件数学期望:
E(y|xi)=1*p(y=1|xi)+0*p(y=0|xi)=p(y=1|xi)
选择一个函数,p(y=1|x)=f(x)=Logistic函数,作为回归方程。即利用观测数据(xi,yi)拟合一个Logistic函数。
根据Logistic函数的定义
p=p(y=1|x)=exp(a+b*x)/(1+exp(a+b*x)),这里p/(1-p)=exp(a+b*x)。