41、深度学习数学原理与张量处理单元解析

深度学习数学原理与张量处理单元解析

1. 梯度下降与反向传播

梯度下降结合反向传播的方法,并不一定能找到损失函数的全局最小值,通常只能找到局部最小值。不过在实际应用中,这未必会成为问题。

1.1 交叉熵及其导数

当采用交叉熵作为损失函数时,可以运用梯度下降法。逻辑损失函数的定义如下:
$E(c) = -\sum[c_{i}\ln(p_{i}) + (1 - c_{i})\ln(1 - p_{i})]$
其中,$c$ 表示独热编码的类别(或标签),$p$ 表示经过 softmax 函数处理后的概率。由于交叉熵应用于经过 softmax 处理的概率和独热编码的类别,在计算关于最终权重分数 $score_{i}$ 的梯度时,需要考虑链式法则。
$ \frac{\partial E}{\partial score_{i}} = \frac{\partial E}{\partial p_{i}}\frac{\partial p_{i}}{\partial score_{i}}$
下面分别计算两个部分:
- 先计算 $\frac{\partial E}{\partial p_{i}}$:
$ \frac{\partial E}{\partial p_{i}} = \frac{\partial(-[c_{i}\ln(p_{i}) + (1 - c_{i})\ln(1 - p_{i})])}{\partial p_{i}} = -\frac{c_{i}}{p_{i}} + \frac{1 - c_{i}}{1 - p_{i}}$
- 再计算 $\frac{\partial p_{i}}{\partial score_{i}

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值