神经网络基础--1.8 向量化Logistic回归的梯度输出及小结

立flag的咸鱼

于 2020-03-05 10:28:41 发布

阅读量198

点赞数

分类专栏：机器学习 # 吴恩达-深度学习文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_41988224/article/details/104657876

版权

机器学习同时被 2 个专栏收录

9 篇文章

订阅专栏

吴恩达-深度学习

9 篇文章

订阅专栏

在1.7 向量化在Logistic回归梯度下降法中的应用（正向传播）中记录了如何通过向量化同时计算整个训练集m个样本的预测值a，本节中描述如何用向量化计算m个训练数据的梯度

原本计算梯度：
$dz^1=a^1-y^1,dz^2=a^2-y^2....dz^m=a^m-y^m$

向量化：

现定义一个1×m的矩阵： $dZ=[dz^1,dz^2....dz^m]$
在上一节1.7中，定义过： $A=[a^1,a^2....a^m]$
定义： $Y=[y^1,y^2....y^m]$
基于以上定义，z的计算可以用一行代码实现：
$dZ=A-Y=[a^1-y^1,a^2-y^2...a^m-y^m]$
矩阵中的每一个元素就是原本计算梯度中对应的每一个式子

在1.7中实现了对下图中下方的for循环向量化，将dw化为一个向量，目前还存在上面那个对训练集遍历的for循环
在这里插入图片描述
之前for循环的实现过程：

$d w = 0$                                    $d b = 0$
$dw+=x^1dz^1$                        $db+=dz^1$
$dw+=x^2dz^2$                        $db+=dz^2$
…                                            …
…                                            …
$d w / = m$                                $d b / = m$

现在针对上述过程进行向量化：
处理db：

$db=\frac{1}{m}\sum_{i=1}^mdz^i$
所有的dz组成了一个行向量 $dZ=A-Y=[a^1-y^1,a^2-y^2...a^m-y^m]$
Python中实现： $\frac{1}{m} np.sum(dZ)$ ，只需要把dZ这个变量传给np.sum函数就可以得到db

处理dw：

$dw=\frac{1}{m}XdZ^T$

小结

回顾1.7和本节内容，总结如何实现一个logistic回归
在这里插入图片描述
一次高度向量化的迭代：
Z=w^TX+b=np.dot(w.T,X)+b
A= $\sigma$ (Z)
dZ=A-Y
dw= $\frac{1}{m}$ XdZ^T
db= $\frac{1}{m}$ np.sum(dZ)

w:=w-αdw
b:b-αdb

如果要实现多次迭代，要在最前面加for循环，这个循环目前无法简化

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。