最大熵模型和Logistic回归

本文探讨了最大熵模型如何导出Sigmoid函数,解释了其在二分类问题中作为激活函数的角色。通过条件熵的数学推导,揭示了Logistic回归与最大熵模型之间的联系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以前博客写过逻辑回归时直接抛出sigmoid函数,然后说它的好处和特性。其实长久以来想知道这玩意是怎么想出来的。最大熵模型是一个比较普遍的机器学习模型,Logistic回归是它在二分类情形下的特例,也就是说sigmoid激活函数就是由最大熵模型推出来的。。

条件熵表示已知随机变量X的情况下,随机变量Y的条件概率分布的熵对X的数学期望:

                                 

表示的联合经验分布,表示关于的特征函数。

                                     

定义在y关于x的后验分布的熵(条件熵)为:

                                                  

最大化上式,得到优化目标:

                                                    

使用拉格朗日乘子法转为无约束优化:

                                       

                                

                                        

对于二分类问题,取特征函数:

                                 

因此得到与Logistic回归一样的表达式:

                                                               

参考:《统计学习方法》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值