理解logistic回归原理解释

需要的知识储备:

概率论中的——似然函数求解

数学的求导公式——e^{x}以及倒数求导。

1. logistic分布的概念,如下图

分布其实就是概率值。

logistic分布为什么常用呢?因为它的分布曲线,在中心附近增长很快,而在两端增长很慢。这就是说,若以概率0.5(中心点z=μ处的分布概率)为分界点,大于μ的点为一类,小于μ的点为另一类,那么,我们能很好很快地把中心点附近的数据分类。

基于这个分布的特点,我们假设训练数据满足如下的模型:

2. Logistic回归的模型,如下图

3. Logistic模型中参数的求法(估计)

有了如上模型的假设,有了训练数据后,我们就可以把模型中的参数给求出来,具体方法如下:

4. 利用模型进行分类
利用3中的方法,得到一个logistic模型的结果如下:
这里写图片描述

则,对于测试数据或未来要分类的数据,我们只需把x带入上面的两个条件概率公式,哪个条件概率的值大,x对应的类别便是哪一类。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值