pytorch深度学习基础（二）——反向传递概念透彻解析以及Python手动实现

艾醒(AiXing-w)

已于 2023-04-15 15:00:03 修改

阅读量2.5k

点赞数 4

分类专栏： # pytorch深度学习基础深度学习方法文章标签： python 深度学习

于 2022-03-15 20:40:47 首次发布

本文链接：https://blog.youkuaiyun.com/DuLNode/article/details/123500624

版权

反向传递概念透彻解析以及Python手动实现

前言
最简单的反向传递
- 乘法层
- 加法层
激活函数的反向传递

前言

我们在感知机中采用了梯度下降的方式实现了参数的优化（手动实现感知机），但是感知机对于较为复杂的问题就显得力不从心了，所以我们需要用到多层感知机，即神经网络。此时的梯度下降就需要通过反向传递来实现了

最简单的反向传递

我们在感知机中进行的最简单的操作就是加法和乘法，这里我们先以乘法和除法为例实现最简单的反向传递

乘法层

公式
我们假设x*y=z，损失函数为L,那么我们分别对z求关于x和y的偏导得
$\frac{ \partial z}{\partial x}=y$
$\frac{\partial z}{\partial y}=x$
得到结论乘法层的偏导为两个乘数互换位置
则
$\frac{ \partial L}{\partial z}\frac{ \partial z}{\partial x}=\frac{ \partial L}{\partial z} \cdot y$
$\frac{ \partial L}{\partial z}\frac{\partial z}{\partial y}=\frac{ \partial L}{\partial z} \cdot x$
代码实现
在反向传递时要遵循链式法则，所以在这里我们每个偏导都要乘以后面一层反向传递来的偏导数dout才是应该传递给上一层的偏导数，下同。

class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = x
        self.y = y                
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy