卷积神经网络（CNN）学习笔记

最新推荐文章于 2025-02-14 00:32:29 发布

hfutdog

最新推荐文章于 2025-02-14 00:32:29 发布

阅读量1.3k

点赞数

分类专栏：机器学习文章标签：卷积神经网络吴恩达深度学习

本文链接：https://blog.youkuaiyun.com/hfutdog/article/details/96679193

版权

本文是吴恩达深度学习课程关于卷积神经网络的学习笔记，涵盖了卷积、padding、步长、池化层等内容。卷积神经网络通过参数共享和稀疏连接减少参数数量，提高模型对平移不变性的捕获能力，防止过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

本篇文章是吴恩达《深度学习》课程《卷积神经网络——第一周》的学习笔记。

计算机视觉

计算机视觉面临的一个挑战是图像的数据量巨大。

上述图片是计算机视觉领域的典型应用：图像分类、风格转换、目标检测。

如上图所示，神经网络第一层参数矩阵巨大，具有三十亿个参数。在这种情况下，难以获取足够的数据来防止神经网络发生过拟合和竞争需求。要处理包含三十亿参数的神经网络，巨大的内存需求让人不能接受。

边缘检测示例：

需要注意的两个点

filter过滤器在论文中有时也称作kernel核。
在数学中，“*”就是卷积的标准标志，Python中表示乘法或者是元素乘法。

Padding

在没有padding时，输入图像维度为 $n * n$ ，滤波器维度为 $f * f$ ，那么输出图像维度为 $(n - f + 1) * (n - f + 1)$ 。缺点在于：每做一次卷积操作，图像就会缩小。
另外，如上图所示，原图中在角落或者边缘区域的像素点，在输出中采用较少，也就是说filter很少触碰到它们，意味着丢掉了图像边缘位置的信息。
若边缘填充像素个数表示成p，那么输出图像的维度为 $(n + 2 p - f + 1) * (n + 2 p - f + 1)$ 。如上图所示，在padding之后，左侧填充绿色像素点的区域（原图左上角像素）影响了右侧填充绿色的像素点。这样，角落或者边缘区域像素点在输出中采用较少的这一缺点就被削弱了。
选择多少像素进行填充，通常由两种方式，分别叫做Valid卷积和Same卷积，如下图所示：

Valid卷积意味着不填充。
Same卷积意味着填充后你的输出图像的大小和输入图像的大小是一样的。Same卷积中padding的大小 $\frac{f-1}{2}$