逻辑回归中的变量处理与评估
1. 案例研究中的数据拉直
在处理数据时,我们常常会遇到需要将数据关系进行拉直的情况。以 FD1_OPEN 与 LGT_TXN 的关系为例,其关系曲线存在凸起,需要进行调整。
- 确定调整方向 :根据凸起规则,对于 FD1_OPEN 与 LGT_TXN 的关系,由于 LGT_TXN 是逻辑回归框架中明确的因变量,对其进行变换会产生不合理结果,所以选择对 FD1_OPEN 进行降阶变换。
- 降阶变换操作 :使用幂次为 ½, 0, −½, −1, 和 −2 对 FD1_OPEN 进行变换,得到以下新变量:
- 平方根变换:FD1_SQRT
- 以 10 为底的对数变换:FD1_LOG
- 负倒数平方根变换:FD1_RPRT
- 负倒数变换:FD1_RCP
- 负倒数平方变换:FD1_RSQ
| 变换方式 | 新变量名称 |
|---|---|
| 平方根 | FD1_SQRT |
| 对数 | FD1_LOG |
| 负倒数平方根 | FD1_RPRT |
| 负倒数 | FD1_RCP |
| 负 |
超级会员免费看
订阅专栏 解锁全文
1745

被折叠的 条评论
为什么被折叠?



