深度学习笔记——卷积神经网络的入门与介绍

最新推荐文章于 2025-04-16 09:00:00 发布

置顶

_kimcho

最新推荐文章于 2025-04-16 09:00:00 发布

阅读量1.3k

点赞数 2

分类专栏：学习总结深度学习 CNN 文章标签：深度学习 CNN 神经网络卷积神经学习笔记

本文链接：https://blog.youkuaiyun.com/weixin_41055137/article/details/81108554

版权

本文详细介绍了卷积神经网络（CNN）的基础知识，包括CNN的功能、产生的原因及其在图像识别中的作用。通过图像的边缘和特征检测，CNN能够构建抽象概念。文章还探讨了CNN相对于全连接网络的优势，如参数共享和局部连接，以减少训练复杂度。此外，讲解了卷积、池化、神经元和激活函数等核心概念，以及CNN在图像分类和特征提取中的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.前言

CNN功能的总体概述:

我们希望电脑能够区分所有的图像，并找出且能识别实际案例（如：识别狗狗或识别小猫）的独特功能。当我们看一只狗的照片时，如果图片具有可识别的特征，例如爪子或四条腿，我们可以对其进行分类。以类似的方式，计算机能够通过寻找诸如边缘和曲线的低级特征，然后通过一系列卷积层来构建更抽象的概念来执行图像分类。举个形象的例子，计算机通过图像得出了的独特特征有：翅膀等，那么很容易我们就可以得知了，这个图像就是鸟儿。

CNN产生的原因：

当使用全连接的神经网络时，因为相邻两层之间的神经元都是有边相连的，当输入层的特征纬度非常高时（譬如图片），全连接网络需要被训练的参数就会非常多（参数太多，训练缓慢），CNN可以通过训练少量的参数从而进行特征提取。

CNN的优点：

1.相邻两层神经元部分相连。2.且同一层神经元的w（权重）和b（偏移）是共享的。

CNN总体工作原理：

给出已分类好的数据进行训练，训练一次后，再把未分类的数据进行分类，(A)根据预测值和真实值之间的损失值进行反向传播，从而更新参数，再次对未分类好的数据进行分类，重复A步骤，直至损失值最小，然后再输出层输出结果

2 神经元

我们知道神经元的主要组成成分：细胞核，树突，轴突，轴突末梢。一个神经元具有多个树突，主要用来接收信息；而轴突只有一条，轴突尾端有许多轴突末梢，可以给其他神经元传递信息。于是根据生物神经元的结构，人们发明了数学上神经元的原型

上述简单的模型可以理解为一个感知器模型，该模型可以理解为一个根据不同因素，以及各个因素所占的重要程度而做决策的模型

如：这周末北京有一草莓音乐节，那去不去呢？决定你是否去有二个因素，这二个因素可以对应二个输入，分别用x1、x2表示。此外，这二个因素对做决策的影响程度不一样，各自的影响程度用权重w1、w2表示。一般来说，音乐节的演唱嘉宾会非常影响你去不去，唱得好的前提下即便没人陪同都可忍受，但如果唱得不好还不如你上台唱呢。所以，我们可以如下表示：

这样，咱们的决策模型便建立起来了

这里的b可以理解成为更好达到目标而做调整的偏置项。

一开始为了简单，人们把激活函数定义成一个线性函数，即对于结果做一个线性变化，比如一个简单的线性激活函数是g(z) = z，输出都是输入的线性变换。后来实际应用中发现，线性激活函数太过局限，于是人们引入了非线性激活函数。

3.神经网络

讲完神经元，我们就来讲一下简单的神经网络，一下是单个神经元：

当多个神经元组织在一起，便形成了神经网络，下图是一个三层的神经网络：

最左端为输入层，中间为隐藏层，最右端为输出层。

输入层：接收讯息的输入，一般来讲，大多都是非线性的。输入的讯息又称为输入向量。

隐藏层：讯息的加权，激活，传输。（可有多个）

输出层：将经过处理的讯息输出，得出结果，输出的讯息又称为输出向量。

同时，每一层都可能由单个或多个神经元组成，每一层的输出将会作为下一层的输入数据。比如下图中间隐藏层来说，隐藏层的3个神经元a1、a2、a3皆各自接受来自多个不同权重的输入（因为有x1、x2、x3这三个输入，所以a1 a2 a3都会接受x1 x2 x3各自分别赋予的权重，即几个输入则几个权重），接着，a1、a2、a3又在自身各自不同权重的影响下成为的输出层的输入，最终由输出层输出最终结果。