ogistic regression属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。例如,在流行病学研究中,经常需要分析疾病与各危险因素之间的定量关系,为了正确说明这种关系,需要排除一些混杂因素的影响。对于线性回归分析,由于应变量Y是一个二值变量(通常取值1或0),不满足应用条件,尤其当各因素都处于低水平或高水平时,预测值Y值可能超出0~1范围,出现不合理都现象。用logistic回归分析则可以较好的解决上述问题。Logistic回归模型的基本形式如下:
因此,对因变量P按照ln(P/(1-P))的形式进行对数变换,可以将Logistic回归问题转化为线性回归问题,在按照多元线性回归的方法求解回归参数。对于P取值只有0和1的情况,在实际中不是直接对P进行回归,而是先定义一个单调连续的概率函数π:
此时Logistic模型为:
然后只需要对原始数据进行合理的映射处理,就可以用线性回归方法得到回归系数,最后再根据π和P的映射关系进行反映射得到P的值。
下面是书中的一个例子,评估企业的还款能力,已知前20家企业的评价指标和评价结果,要求对剩余5家企业进行评估。数据如下:
Π到P的映射关系:
Π值的确定:
Matlab代码如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
Matlab运行结果如下:
第一行即为该问题中回归模型的系数,带入即可得到回归模型,第二行为该模型的评估结果。
Logistic回归详解
本文深入介绍了Logistic回归作为概率型非线性回归方法的应用,特别适用于二分类问题的研究。通过实例详细展示了如何利用Logistic回归分析来评估企业还款能力,并提供了Matlab实现代码。
3765

被折叠的 条评论
为什么被折叠?



