3、计算机视觉模型架构、技术及PyTorch入门

计算机视觉模型架构、技术及PyTorch入门

1. 经典卷积神经网络架构
  • VGG架构
    • 结构 :VGG架构图包含conv 1 - conv 5卷积块,每个卷积块使用ReLU激活函数,随后是最大池化层,最后连接FC 6、FC 7和FC 8全连接网络。
    • 优势与问题 :它开创了深度网络应用的先河,但提出时未使用批量归一化,存在内部协变量偏移和梯度中途消失问题。采用3x3和1x1卷积组合,堆叠三个3x3卷积在参数上优于一个7x7卷积(3x3卷积参数为27C²,7x7卷积参数为49C²),且三个3x3卷积的感受野与一个7x7卷积相同,同时具有更多自适应功能。
    • 1x1卷积作用 :作为特征图特征的混合器,起到z轴降维作用,可作为跨通道池化,虽可增加通道数但实际较少使用,因其能轻松总结特征图内容。VGG是对传统CNN架构的重大改进,是2015年的先进算法。
  • ResNet架构
    • 背景与优势 :是用于图像下游任务的先进架构,凭借残差学习框架赢得2015年ILSVRC竞赛,也是YOLO和Faster R - CNN等目标检测算法的骨干网络。
    • 残差结构 :基本结构是将上一层输出X同时传递给残差函数f(x)和恒等函数,最终结果为f(x) + x。该结构旨在解决深度网络准确率下降
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值