计算机视觉模型架构、技术及PyTorch入门
1. 经典卷积神经网络架构
- VGG架构
- 结构 :VGG架构图包含conv 1 - conv 5卷积块,每个卷积块使用ReLU激活函数,随后是最大池化层,最后连接FC 6、FC 7和FC 8全连接网络。
- 优势与问题 :它开创了深度网络应用的先河,但提出时未使用批量归一化,存在内部协变量偏移和梯度中途消失问题。采用3x3和1x1卷积组合,堆叠三个3x3卷积在参数上优于一个7x7卷积(3x3卷积参数为27C²,7x7卷积参数为49C²),且三个3x3卷积的感受野与一个7x7卷积相同,同时具有更多自适应功能。
- 1x1卷积作用 :作为特征图特征的混合器,起到z轴降维作用,可作为跨通道池化,虽可增加通道数但实际较少使用,因其能轻松总结特征图内容。VGG是对传统CNN架构的重大改进,是2015年的先进算法。
- ResNet架构
- 背景与优势 :是用于图像下游任务的先进架构,凭借残差学习框架赢得2015年ILSVRC竞赛,也是YOLO和Faster R - CNN等目标检测算法的骨干网络。
- 残差结构 :基本结构是将上一层输出X同时传递给残差函数f(x)和恒等函数,最终结果为f(x) + x。该结构旨在解决深度网络准确率下降
超级会员免费看
订阅专栏 解锁全文
98

被折叠的 条评论
为什么被折叠?



