LR为什么用sigmoid函数。这个函数有什么优点和缺点?为什么不用其他函数?

本文探讨了伯努利分布的基本概念及其在逻辑回归中的应用。解释了如何将伯努利分布转化为指数分布,并进一步推导出sigmoid函数,详细阐述了逻辑回归的数学原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先lr满足伯努利分布,而伯努利分布可以转化为指数分布,只要类条件概率满足指数分布的,其后验都可以写成sigmoid函数的形式。这是说lr可以转化为sigmoid。

什么是伯努利分布?

伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)。

  • 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言:

伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等

  • 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
  • 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。

逻辑回归的损失函数非指数族

逻辑回归的损失函数非指数族,形势为: 

逻辑回归认为函数其概率服从伯努利分布,将其写成指数族分布的形式,也就是: 
                                      T(y)=y

                                  α(η)=−log(1−ϕ)

                                      b(y)=1
能够推导出sigmoid函数的形式。 
                               \eta = log(\frac{\phi}{1-\phi})

                               \phi = \frac{e^\eta}{1+e^\eta}

也就推出了sigmid函数的形式

sigmoid:
优点:实现简单,可以无限求导。而且可以从(负无穷,正无穷)映射到(0,1),符合概率分布
缺点:导数形式在(0,0.25),容易出现梯度消失;只能处理二分问题。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值