图像分类网络结构记录

分类网络

分类网络简单说来就是判断图片中是否存在需要检测的物体,按照存在的物体类别进行分类。分类网络从提出发展到现在,经过了多种变化,效果越来越好,结构也越累越复杂,我学习的步骤是LeNet ,AlexNet,ZFNet,VGGNet,GoogLeNet,ResNet。

LeNet

LeNet的提出非常早,也是首个将神经网络用于图像分类中。其中利用了卷积池化全连接等操作,提取图像的特征,完成了分类识别。并且实现了参数共享大大减小了计算量。LeNet5应用于手写数字识别中。
在这里插入图片描述
如图所示,LeNet网络总共有7层,输入时首先将图片大小调整为32321,第一层为卷积层,卷积核大小为5 * 5,卷积核数量为6,输出特征图像大小为28 * 28 * 6。第二层为池化层,过滤器大小为2 * 2,长和宽的部长都为2,输出图像大小为14 * 14 * 6。第三层位卷积层,卷积核大小为5 * 5,数量为16,输出图像大小为10 * 10 * 16。第四层为池化层,过滤器大小为2 * 2,步长为2,输出大小为5 * 5 * 16。第五层为全连接层(也可以看作是5 * 5大小的卷积层),输出为120个1 * 1特征信息。第六层为全连接层,输出为84,第七层为全连接层,输出为10,分别代表十个数字。
LeNet对于手写数字识别具有非常好的效果,并且参数较少,但是受制于计算能力的限制,不能用于复杂的图像分类中。

AlexNet

AlexNet是在2012年提出的,并取得了那年的ImageNet大赛的冠军,AlexNet的重要意义在于重新提起了对于卷积网络的热度,这是严格意义上第一个深度学习的网络结构,从此各种深度网络在此基础进行改进或者启发。其结构图如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值