31、从零开始实现多层人工神经网络对手写数字进行分类

最新推荐文章于 2025-12-02 20:13:55 发布

青柠汽水308

最新推荐文章于 2025-12-02 20:13:55 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏：掌握Python机器学习文章标签：多层感知机神经网络 MNIST

本文链接：https://blog.youkuaiyun.com/solidity8miner/article/details/155049043

掌握Python机器学习专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

从零开始实现多层人工神经网络对手写数字进行分类

1. 神经网络计算的泛化

我们可以将计算泛化到训练数据集中的所有 $n$ 个示例：
- $\mathbf{Z}^{(h)} = \mathbf{A}^{(in)}\mathbf{W}^{(h)}$
这里，$\mathbf{A}^{(in)}$ 是一个 $n \times m$ 的矩阵，矩阵乘法将得到一个 $n \times d$ 维的净输入矩阵 $\mathbf{Z}^{(h)}$。
- 最后，我们对净输入矩阵中的每个值应用激活函数 $\phi(\cdot)$，以得到下一层（这里是输出层）的 $n \times d$ 激活矩阵：
$\mathbf{A}^{(h)} = \phi(\mathbf{Z}^{(h)})$

同样，我们可以用向量化形式为多个示例写出输出层的激活：
- $\mathbf{Z}^{(out)} = \mathbf{A}^{(h)}\mathbf{W}^{(out)}$
这里，我们将 $d \times t$ 矩阵 $\mathbf{W}^{(out)}$（$t$ 是输出单元的数量）与 $n \times d$ 维矩阵 $\mathbf{A}^{(h)}$ 相乘，以获得 $n \times t$ 维矩阵 $\mathbf{Z}^{(out)}$（此矩阵中的列表示每个样本的输出）。
- 最后，我们应用 sigmoid 激活函数以获得网络的连续值输出：
$\mathbf{A}^{(out)} = \phi(\mathbf{Z}^{(out)})$，$\mathbf{A}^{(out)} \in \mathbb{R}^{n \times t}$