图像分类与实时表情识别研究
一、改进的Xception模型用于图像分类
1.1 Xception模块与CBAM模块
- Xception模块 :Xception网络整体分为Entry、Middle和Exit三部分,共有36层。它基于Inception V3并结合了深度可分离卷积,能分别考虑通道间相关性和空间相关性,在不增加参数的情况下取得良好效果,提高了网络效率。其在许多领域都有应用,如改进U - Net架构进行遥感图像建筑提取、用于烟雾检测等。
- Convolutional Block Attention Module(CBAM) :为关注重要局部细节区域并过滤不重要信息,采用CBAM。它与其他注意力机制出发点相同,但通过通道注意力模块和空间注意力模块依次获取特征图,能让我们更关注图像间细微局部差异,放大局部特征代表性。其数学形式如下:
- 通道注意力特征:
[Mc(F) = σ(MLP(AvgPool(F)) + MLP(MaxPool(F))) = σ\left(W_1\left(W_0\left(F_{c_{avg}}\right)\right) + W_1\left(W_0\left(F_{c_{max}}\right)\right)\right), W_0 \in R^{C/r×C}, W_1 \in R^{C×C/r}] - 空间注意力特征同理:
[MC(F) = σ(MLP(AvgPool(F)) + MLP(MaxPool(F))) = σ\left(W_1\left(W_0\left(F_{c_{a
- 通道注意力特征:
超级会员免费看
订阅专栏 解锁全文
3718

被折叠的 条评论
为什么被折叠?



