浅层神经网络(Shallow neural networks)学习笔记-优快云博客

本文档详细介绍了浅层神经网络的基本概念，包括计算神经网络输出的方法、多样本向量化处理以及激活函数的选择。探讨了从单个神经元到整个神经网络的计算流程，以及如何在多个训练样本上应用向量化技术。同时，对比了sigmoid、tanh和ReLU等激活函数的特性及适用场景。

浅层神经网络个人学习笔记Shallow neural networks

作者arsoooo

1.1 计算一个神经网络的输出（Computing a Neural Network’s output）

在逻辑回归中，我们有a直接等于yhat，是因为在逻辑回归中我们只有一个输出层，所以我们没有用带方括号的上标。此处多层的神经网络，yhat表示最终输出，a表示中间层的输出，这些输出作为输入传入下一层里继续计算，所以又叫做激活值。
在这里插入图片描述
图中上标表示神经网络的层数，下标表示该层的第几个神经元，这是神经网络的符号惯例。
接下来计算一个神经网络的输出：

从隐藏层的第一个神经元开始计算，如上图第一个最上面的箭头所指。从上图可以看出，输入与逻辑回归相似，每个神经元的计算与逻辑回归一样分为两步，隐藏层的第二个以及后面两个神经元的计算过程一样，只是注意符号表示不同。在这里插入图片描述
向量化的过程是将神经网络中的一层神经元参数纵向堆积起来，例如隐藏层中的w纵向堆积起来变成一个(4,3)的矩阵，用符号W[1]表示。得到Z[1]后，a[1] = sigmoid(Z[1])，接着通过a[1]进行一次计算得到a[2]。