神经网络基础--1.7 向量化Logistic回归（正向传播）

最新推荐文章于 2021-11-22 20:49:16 发布

立flag的咸鱼

最新推荐文章于 2021-11-22 20:49:16 发布

阅读量186

点赞数

分类专栏：机器学习 # 吴恩达-深度学习文章标签：神经网络

版权

9 篇文章

订阅专栏

9 篇文章

订阅专栏

在这里插入图片描述

计算logistic回归导数：

在程序中有两个for循环

想要去掉下面的那个循环，不显式地把dw1、dw2等初始化为0，把dw变成一个n_x*1维的向量

设有m个样本，原本需要计算：
在这里插入图片描述
需要重复上述步骤m次
处理z¹、z²…z^m：

现把所有训练样本堆叠起来，定义一个n_x×m的矩阵X作为训练的输入（n_x，m）：
构建一个1×m的矩阵，计算z¹、z²…z^m都在同一时间，结果可以发现它可以表示为： $Z=[z^1,z^2...z^m]=w^TX+[b,b,b...b]$
w^T是一个行向量：

[b b b…b]是一个1×m的向量
最后得到一个1×m的行向量：
$Z=[z^1,z^2...z^m]=w^TX+[b,b,b...b]=[w^Tx^1+b,w^Tx^2+b...w^Tx^m+b]$
最后行向量里的每一个元素，刚好是原始方法（本小节第一张图片中的三列公式）中的z¹、z²…z^m
使用numpy实现：

#Python此处的b是一个实数不是矩阵，但把前面的(w.T,X)向量和b相加时，Python会自动将b扩展成一个1×m的行向量
#上述过程在Python中称为 广播
Z=np.dot(w.T,X)+b

处理a¹、a²…a^m：

以上，是正向传播一步迭代的向量化实现，同时处理所有m个样本