首先lr满足伯努利分布,而伯努利分布可以转化为指数分布,只要类条件概率满足指数分布的,其后验都可以写成sigmoid函数的形式。这是说lr可以转化为sigmoid。
什么是伯努利分布?
伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)。
- 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言:
伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等
- 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
- 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。
逻辑回归的损失函数非指数族
逻辑回归的损失函数非指数族,形势为:
逻辑回归认为函数其概率服从伯努利分布,将其写成指数族分布的形式,也就是:
T(y)=y
α(η)=−log(1−ϕ)
b(y)=1
能够推导出sigmoid函数的形式。
也就推出了sigmid函数的形式
sigmoid:
优点:实现简单,可以无限求导。而且可以从(负无穷,正无穷)映射到(0,1),符合概率分布
缺点:导数形式在(0,0.25),容易出现梯度消失;只能处理二分问题。