第二十八篇 SeNet模型解析

AI智韵

已于 2023-06-29 06:34:34 修改

阅读量9k

点赞数

分类专栏：深度学习精讲与实战（2025）文章标签：计算机视觉深度学习人工智能神经网络 pytorch

于 2023-06-28 21:03:28 首次发布

不能复制，转发

本文链接：https://blog.youkuaiyun.com/m0_47867638/article/details/131444746

版权

深度学习精讲与实战（2025）专栏收录该内容

47 篇文章 ¥19.90 ¥99.00

订阅专栏

SENet是一种创新的神经网络结构，通过Squeeze-and-Excitation模块学习特征通道的权重，增强了模型对特征的利用率。该模型在ImageNet竞赛中取得显著成果，能有效建模通道间依赖，且易于融入其他网络架构，如ResNet。SE模块包括全局平均池化、全连接层和Sigmoid激活，以实现特征的重标定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、SENet概述

Squeeze-and-Excitation Networks（简称 SENet）是 Momenta 胡杰团队（WMW）提出的新的网络结构，利用SENet，一举取得最后一届 ImageNet 2017 竞赛 Image Classification 任务的冠军，在ImageNet数据集上将top-5 error降低到2.251%，原先的最好成绩是2.991%。

作者在文中将SENet block插入到现有的多种分类网络中，都取得了不错的效果。作者的动机是希望显式地建模特征通道之间的相互依赖关系。另外，作者并未引入新的空间维度来进行特征通道间的融合，而是采用了一种全新的「特征重标定」策略。具体来说，就是通过学习的方式来自动获取到每个特征通道的重要程度，然后依照这个重要程度去提升有用的特征并抑制对当前任务用处不大的特征。

通俗的来说SENet的核心思想在于通过网络根据loss去学习特征权重，使得有效的feature map权重大，无效或效果小的feature map权重小的方式训练模型达到更好的结果。SE block嵌在原有的一些分类网络中不可避免地增加了一些参数和计算量，但是在效果面前还是可以接受的。Sequeeze-and-Excitation(SE) block并不是一个完整的网络结构，而是一个子结构，可以嵌到其他分类或检测模型中。

了解本专栏