CNN概述

原创

已于 2025-04-25 22:22:43 修改 · 946 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-04-16 01:43:20 首次发布

卷积神经网络（Convolutional Neural Networks, CNN）是一种专门用于处理网格状数据（如图像或时间序列）的深度学习神经网络。CNN通过引入卷积操作、池化操作和全连接层，能够高效地提取数据中的空间特征，特别适用于图像分类、目标检测、图像分割等任务。

与传统全连接神经网络相比，CNN的优势在于：

CNN的设计灵感来源于生物视觉系统（如猫的视觉皮层）。Hubel和Wiesel的研究发现，视觉神经元对局部区域的刺激敏感，且不同神经元负责检测不同类型的特征（如边缘、纹理）。CNN通过以下机制模拟这一过程：

卷积是CNN的核心操作，用于提取输入数据的局部特征。数学上，二维卷积定义为： $\sum_{m} \sum_{n} I(x+m, y+n) \cdot K(m, n)$ ，其中：

卷积核大小：如 $\times 3$ 、 $\times 5$ 。
步幅（Stride）：卷积核滑动的步长，控制输出尺寸。
填充（Padding）：在输入边缘填充零（zero-padding），保持输出尺寸。
输出尺寸公式： $Hout=⌊Hin+2⋅padding−khstride⌋+1H_{\text{out}} = \left\lfloor \frac{H_{\text{in}} + 2 \cdot \text{padding} - k_h}{\text{stride}} \right\rfloor + 1$