二分类问题的sigmoid交叉熵损失函数推导

本文章参考deeplearning 一书第六章6.2.2.2  Sigmoid Units for Bernoulli Output Distributions  

要建立一个模型,不可或缺的有:1、数据,2、损失函数,3、模型算法,4、优化算法。

今天我们讨论下损失函数这块。损失函数的设计,与模型最后输出的内容是有一定关联的。所以我们今天讨论二分类问题的损失函数时,主要讲两方面,一方面是模型的输出,一方面是最大似然估计。

 

sigmoid输出值 和 伯努利概率之间的关系

就二分类问题而言,我们现在都了解,一般情况下计算出\mathbf{w}^{^{T}}\cdot \mathbf{h}+b之后,会将σ(\mathbf{w}^{^{T}}\cdot \mathbf{h}+b)作为模型的输出,并且当作是P(y=1|x)  (这里的P(y=1|x) 是伯努利分布中随机变量为1的概率)。那么σ(\mathbf{w}^{^{T}}\cdot \mathbf{h}+b)和 P(y=1|x)之间有怎样的关系呢?deeplearning一书中的6.2.2.2给出了推导。

以下都以书中的公式为准。

一个sigmoid output unit 是这样定义的:(这里的h指的是隐藏层单元,这里的σ就是 logistic sigmoid function,有忘记公式的可以搜一下)

\hat{y}=\sigma (\mathbf{w}^{^{T}}\cdot \mathbf{h}+b)       

那么在线性层输出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值