论文笔记：SqueezeNet

最新推荐文章于 2025-02-25 07:00:00 发布

John2King

最新推荐文章于 2025-02-25 07:00:00 发布

阅读量3.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： DL 文章标签： squeezeNet

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lebula/article/details/53384936

DL 专栏收录该内容

15 篇文章

订阅专栏

SqueezeNet通过使用1*1卷积核替换3*3，减少输入channel及延后下采样，实现参数大幅减少。其核心组件Fire Module包含squeeze和expand阶段，有效平衡准确率和模型复杂度。在ImageNet上，SqueezeNet参数量仅为AlexNet的1/50，但top1准确率提高至57.5%，top5准确率保持在80.3%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.相同准确率下，参数更少的模型有三个好处：

1）高效的分布式训练

2）替换模型更容易

3）FPGA部署遍更便利

2.本文三个策略：

1）用1*1的核来替换3*3的核，可以减少9倍参数

2）减少输入到3*3核的输入channel数量，因为参数由N*C*W*H决定

3）延后下采样，使得卷基层有较大的activtion maps。关于这一点文章提到K.He有篇文章说较大的特征图会带来较高的准确率。有时间了要拜读一下

3.Fire Module

1）组成：squeeze + expand

其中squeeze是由s1个1*1的卷积核组成的，送入expand 部分，对应策略1

expand由e1个1*1的卷积核以及e3各3*3的卷积核组成的

2）一般令 s1 < e1 + e3, 这样可以限制输入到3*3核的channel。对应策略2

3）stride为2的max-pooling只位于conv1,fire4,fire8,conv10。对应策略3

4）其他细节：

zero-padding在3*3核的输出，使其与1*1的输出大小一致

如NIN一样没有FC

caffe中用两个conv layer,然后concat来实现

4.结论:

参数较alexNet减少50倍，top1 imagenet准确率反而略有提升(57.2 -> 57.5),top5没有降低（80.3）

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。