卷积神经网络架构的最新进展与应用
1. 引言
在计算机视觉领域,卷积神经网络(CNN)取得了显著的进展。本文将介绍CNN在图像分类、目标检测和图像分割三个主要子领域的一些成功架构,并探讨其应用领域。
2. 图像分类
图像分类假设输入图像包含单个对象,需要使用CNN模型将图像分类到预先选择的目标类别之一。以下是一些主要的用于图像分类的CNN架构:
- LeNet - 5
- 由LeCun等人在1998年提出,是最早的CNN架构之一,用于对手写数字进行分类。
- 具有5个可训练层,包括3个卷积层和2个全连接层。前两个卷积层后接最大池化层,最后一个卷积层后接两个全连接层,最后一层作为分类器,可对10个数字进行分类。
- 关键要点:
- 在MNIST数字数据集上进行训练。
- 使用Sigmoid非线性作为激活函数。
- 使用随机梯度下降(SGD)学习算法,训练20个周期。
- 动量因子值为0.02。
- 在MNIST数据集上的测试错误率降至0.95%。
- AlexNet
- 2012年由Krizhevky等人受LeNet启发设计,用于对ImageNet数据进行分类。
- 由8个可学习层组成,前5层是卷积层,后3层是全连接层。最后输出层借助1000个单元将输入图像分类到ImageNet数据集的一千个类别之一。
- 关键要点:
- 在每个卷积层和全连接层后使用修正线性单元(ReLU)非线性激活函数。
- 在每个局部响应归一化(LRN)层和最后一个卷积层后使用最大池
超级会员免费看
订阅专栏 解锁全文

1442

被折叠的 条评论
为什么被折叠?



