昇思25天学习打卡营第10天|ShuffleNet图像分类

最新推荐文章于 2025-12-22 19:38:24 发布

原创

最新推荐文章于 2025-12-22 19:38:24 发布 · 801 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#shuffleNet #神经网络

ShuffleNet网络结构

ShuffleNet是一种专为移动设备设计的、计算效率极高的卷积神经网络（CNN）架构。其网络结构的设计主要围绕减少计算复杂度和提高模型效率展开，通过引入逐点分组卷积（Pointwise Group Convolution）和通道洗牌（Channel Shuffle）两种新技术，实现了在保持精度的同时大幅降低计算成本。

逐点分组卷积（Pointwise Group Convolution）：

逐点分组卷积是ShuffleNet中用于减少1x1卷积计算复杂度的方法。它将输入特征图的通道分成多个组，每个组内的通道独立进行1x1卷积，从而显著降低了计算量。
在这里插入图片描述

然而，这种方法可能导致通道间的信息无法充分交流，影响模型的表达能力。可能会降低网络的特征提取能力。

通道洗牌（Channel Shuffle）：

为了解决逐点分组卷积带来的通道间信息交流不足的问题，ShuffleNet引入了通道洗牌操作。通过均匀地打乱不同分组中的通道，使得每个分组都能获得来自其他分组的信息，从而增强模型的特征提取能力。

在这里插入图片描述

将开始和最后的 1×1卷积模块（降维、升维）改成Point Wise Group Convolution；
为了进行不同通道的信息交流，再降维之后进行Channel Shuffle；
降采样模块中， 3×3 Depth Wise Convolution的步长设置为2，长宽降为原来的一般，因此shortcut中采用步长为2的 3×3平均池化，并把相加改成拼接。

ShuffleV1Block

class ShuffleV1Block(nn.Cell):
    def __init__(self, inp, oup, group, first_group, mid_channels, ksize, stride):
        super(ShuffleV1Block, self).__init__()
        self.stride = stride
        pad = ksize // 2
        self.group = group
        if stride == 2:
            outputs = oup - inp
        else:
            outputs = oup
        self.relu = nn.ReLU()
        branch_main_1 = [
            GroupConv(in_channels=inp, out_channels=mid_channels,
                      kernel_size=1, stride=1, pad_mode="pad", pad=0,
                      groups=1 if first_group else group),
            nn.BatchNorm2d(mid_channels),
            nn.ReLU(),
        ]
        branch_main_2 = [
            nn.Conv2d(mid_channels, mid_channels, kernel_size=ksize, stride=stride,
                      pad_mode='pad', padding=pad, group=mid_channels,
                      weight_init='xavier_uniform', has_bias=False),
            nn.BatchNorm2d