定序回归
以信用卡用户逾期还款情况的调查为例
案例介绍
本案例数据包含了用户信用卡使用记录。其中,我们关心的是信用卡是否出现逾期缴费的情况,什么样的人更容易逾期不缴,什么样的人逾期时间更长。
首先,考虑因变量status(逾期状态):status=0表示按期还款;status>1分为7类,(括号内为逾期天数)
- 1= (1-30)
- 2= (31-60)
- 3= (61-90)
- 4= (91-120)
- 5= (121-150)
- 6= (151-180)
- 7= (180+)
为了将问题具体化,我们将status转变为两部分变量:
Y1: 是否按期还款(status=0时,Y1=1;否则,Y1=0)
- 1= 是
- 0= 否
Y2: 逾期严重程度(参考status各类的样本量,合并为4类)
- 1= (1-30)
- 2= (31-60)
- 3= (61-90)
- 4= (91+)
a=read.csv("4-mac.csv",heade