数据分析1(Logistic回归)

这周讲数据分析,我主要讲svm,但是听别人讲Logit回归模型和决策数时,我发现自己有些不清楚的地方,看来接触一个东西就需要学透彻一点,所以,我想好好看看Logistic模型、决策树和SVM,然后总结一下。

1. Logistic回归和Logit回归区别

Logit回归模型等式的左边可以理解为log-it,it指odds,也就是胜率,即 p 1 − p \frac{p}{1-p} 1pp,等式右边是自变量的线性组合。而Logistic回归模型,也就是Logistic函数,等式左边是概率p,等式右边是一个分式。Logistic函数就是机器学习中sigmoid函数。
参考资料:Logit模型和Logistic模型有什么区别?

2. Logistic回归在机器学习、计量经济中的应用

在我之前的认识里,我们一般使用Logistic回归做二分类,如果计算出来概率大于0.5,那么就是Y=1,如果概率小于0.5,那么就是Y=0。在机器学习中,直接将数据喂入模型,然后优化损失函数,通过梯度下降找到最优的参数β,但是今天听师妹讲Logistic回归,她用的例子是用logistic预测用户留存,也是将数据划分为训练集和测试集,分别进行模型的训练,然后还会使用逐步回归剔除一些不显著的变量,我当时觉得很奇怪,怎么在机器学习中没有剔除掉这些变量呢?
首先,如果自变量和因变量之间没有显著的相关关系,还放在回归模型中肯定会影响回归效果,我想删掉变量不就相当于让这个变量的系数变为0么,机器学习像是一个黑盒,我们只关心模型的效果,准确率怎么样,但是为什么?哪些变量是相关的,这些都是不关心的问题,但在计量中,会探究其中的关系,除了相关关系,更重要的是探究因果关系,这样才能回答为什么,解释这种现象背后的机制。

3. 如何使用python实现

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值