logistic回归研究 2016.04.28回顾

本文探讨了Logistic Regression中的WOE变量处理方法及其符号变化的影响,并讨论了正负类别标记对预测概率的影响。此外,文中还提及了Odds Ratio (OR) 的概念及其在模型中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  昨天的话,主要就干了一个事情,就是对logistic regression的研究

1、从最开始的woe开始说起,一般来说woe公式是ln((Bi/BT)/(Gi/GT)),但是我偶然发现tony的WOE是用的ln((Gi/GT)/(Bi/BT)),由于ln(A/B) = ln(A) - ln(B),所以ln(A/B) = - ln(B/A),相当于说就是所有的输入变量添加了一个负号,当时就这个问题讨论了2个多小时,我当时结合到最后tony的logistic regression结果进行了猜测,因为最后结果,tony的公式是1/(1+e^z),和书本上的1/(1+e^(-z))是互补的关系,我当时sb地猜想woe的符号导致了最后结果是1/(1+e^z),而并非1/(1+e^(-z)),后来思考发现,添加负号进去拟合,拟合出来的系数只不过变号而已,比如以前是a0+a1x1+a2x2,现在把变号过后的-x带入就变成了a0+((-a1)x1)+((-a2)x2),也就是可以把负号提出来把-a1和-a2看成整体,那现在就是按照规则训练出一套系数,这个系数除了常数项,其他系数取反就可以了

2、至于我最以前的问题,为什么tony的公式是1/(1+e^z)?我思考了下,1/(1+e^-z)其实是一样的,最后拟合出来只不过符号不一样,推理过程类似于上一点!所以最后g(Z)算出来都是1的概率,但是如果反着标记,逾期为0,非逾期为1,那就跟着颠倒了,但是如果两类只是A类和B类,那怎么说呢?为什么一般阳性为1,我得到的就是阳性概率呢?难道是28中少的部分?如果一样多呢?我发现我一时半会不能解决这个问题了!那先把这个问题放一放!说明logistic的水很深,真正会玩的人很少!

3、最后要下班的时候还研究了一下odds ratio,简称OR,这个指标我也没理解,还需要深入研究!


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值