当因变量Y有两个值:认同(1),否定(0),这时线性回归肯定不好使了
限制在[0,1]之中的函数有很多,常用的是logist和正态分布的分布函数
P{y=1∣x}=P{(α+βx+ε)>0}=P{ε>−(α+βx)}设ε的分布是logist分布=P{ε>(α+βx)}=11+e−(α+βx)P\{ y=1|x\}=P\{ (α+ βx+ ε)>0\}\\
=P\{ ε> -(α+ βx)\} \\
设ε的分布是logist分布\\
=P\{ ε> (α+ βx)\} =\frac{1}{1+e^{ -(α+ βx)}}P{y=1∣x}=P{(α+βx+ε)>0}=P{ε>−(α+βx)}设ε的分布是logist分布=P{ε>(α+βx)}=1+e−(α+βx)1
线性化−−−−−−−−−−−−−−−−−−−−−−p1−p=e(α+βx)lnp1−p=α+βx线性化----------------------\\\frac{p}{1-p}=e^{ (α+ βx)} \\ ln\frac{p}{1-p}= α+ βx 线性化−−−−−−−−−−−−−−−−−−−−−−1−pp=e(α+βx)ln1−pp=α+βx
根据观测值使用极大似然估计估计α,β根据观测值使用极大似然估计估计α,β \\
根据观测值使用极大似然估计估计α,β
拟合优度的检验:
1.Hosmer-Meleshow检验:
2.AIC,SC,BIC(用于评价对同一组数据进行拟合的多个模型,越小越精确)
3.似然比检验