【深度学习技术】python 反向传播求梯度

最新推荐文章于 2022-12-24 16:11:27 发布

原创最新推荐文章于 2022-12-24 16:11:27 发布 · 1.9k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #反向传播求梯度

Deep Learning 专栏收录该内容

24 篇文章

订阅专栏

本文通过一个具体的数学示例，详细解析了反向传播算法的工作原理，包括复合表达式的求解、链式法则的应用以及梯度的计算过程。此外还提到了门单元的含义、学习率的选择及梯度更新的方法。

反向传播

这里写图片描述

当有激活函数的时候传播的方式如下：

这里写图片描述

复合表达式、链式法则、反向传播

链式法则：将偏导数相乘。

对于一个符合表达式：

这里写图片描述

# -*- coding: utf-8 -*-
"""
Created on Fri Dec 23 17:24:24 2016

@author: CrazyVertigo
"""

import math

x = 3 # 例子数值
y = -4 # 前向传播 
sigy = 1.0 / (1 + math.exp(-y)) # 分子中的sigmoi          #(1) 
num = x + sigy # 分子                                    #(2)
sigx = 1.0 / (1 + math.exp(-x)) # 分母中的sigmoid         #(3) 
xpy = x + y #(4) 
xpysqr = xpy**2 #(5) 
den = sigx + xpysqr # 分母                                #(6) 
invden = 1.0 / den #(7) f = num * invden # 搞定！  #(8)


# 回传 f = num * invden 
dnum = invden # 分子的梯度                                     #(8) 
dinvden = num #(8) # 回传 
invden = 1.0 / den 
dden = (-1.0 / (den**2)) * dinvden #(7) 
# 回传 den = sigx + xpysqr 
dsigx = (1) * dden #(6) 
dxpysqr = (1) * dden #(6) 
# 回传 xpysqr = xpy**2 
dxpy = (2 * xpy) * dxpysqr #(5) 
# 回传 xpy = x + y 
dx = (1) * dxpy #(4) 
dy = (1) * dxpy #(4) # 回传 sigx = 1.0 / (1 + math.exp(-x)) 
dx += ((1 - sigx) * sigx) * dsigx # Notice += !! See notes below  #(3) 
# 回传 num = x + sigy 
dx += (1) * dnum #(2) 
dsigy = (1) * dnum #(2) 
# 回传 sigy = 1.0 / (1 + math.exp(-y)) 
dy += ((1 - sigy) * sigy) * dsigy #(1)