神经网络简介 & 利用minist数据集实现手写数字识别和识别精度计算

最新推荐文章于 2025-10-06 01:59:19 发布

原创

最新推荐文章于 2025-10-06 01:59:19 发布 · 2.8k 阅读

24 ·

CC 4.0 BY-SA版权

本文深入浅出地讲解了神经网络的基本原理，包括前向传播、激活函数的选择及其在手写数字识别中的应用。通过具体实例，展示了三层神经网络的设计与实现过程，以及如何利用MNIST数据集进行模型训练与评估。

该文章已生成可运行项目，

文章目录

一.引子
二. 神经网络（三层简单实现）
三. 手写数字识别

本博客借鉴了《深度学习入门：基于python的理论与实现》的第三章：神经网络

一.引子

博客主要介绍神经网络的前向传播。本章介绍的神经网络和上一章的感知机在信号的按层传递这一点上是相同的，但是，向下一个神经元发送信号时，改变信号的激活函数有很大差异。神经网络中使用的是平滑变化的sigmoid 函数，而感知机中使用的是信号急剧变化的阶跃函数。这个差异对于神经网络的学习非常重要
。同时注意神经网络中激活函数必须非线性，否则多层网络无意义了。

二. 神经网络（三层简单实现）

2.1 总图

在这里插入图片描述

2.2输入层到第一层信号传递：

在这里插入图片描述

X = np.array([1.0, 0.5]) #输入
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]]) #权重
B1 = np.array([0.1, 0.2, 0.3])#偏置 
print(W1.shape) # (2, 3) 
print(X.shape)  # (2,) 
print(B1.shape) # (3,)
A1 = np.dot(X, W1) + B1 #这个A1的结果还没有经过激活函数的运算
Z1 = sigmoid(A1) #激活后  上图中h()表示激活函数

2.3第一层到第二层的信号传递:

在这里插入图片描述

W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]]) #权重
B2 = np.array([0.1, 0.2])#偏置
print(Z1.shape) # (3,) 
print(W2.shape) # (3, 2) 
print(B2.shape) # (2,)
A2 = np.dot(Z1, W2) + B2 #z1是当前的输入，是0~1层传递的输出
Z2 = sigmoid(A2)#激活后

2.4 第二层到输出的信号传递：

在这里插入图片描述
这里我们定义了identity_function()函数（也称为“恒等函数”），并将其作为输出层的激活函数。恒等函数会将输入按原样输出，因此，这个例子中没有必要特意定义identity_function()。这里这样实现只是为了和之前的流程保持统一。另外，图3-20中，输出层的激活函数用σ()表示，不同于隐藏层的激活函数h()（σ读作sigma）。另外，图3-20中，输出层的激活函数用σ()表示，不同于隐藏层的激活函数h()

def identity_function(x):    
	return x
W3 = np.array([[0.1, 0.3], [0.2, 0.4]]) 
B3 = np.array(</

本文章已经生成可运行项目

最低0.47元/天解锁文章

神经网络简介 & 利用minist数据集实现手写数字识别和识别精度计算

文章目录

一.引子

二. 神经网络（三层简单实现）

2.1 总图

2.2输入层到第一层信号传递：

2.3第一层到第二层的信号传递:

2.4 第二层到输出的信号传递：

1 条评论