ShuffleNetV1 当GConv的groups = input_channels,即为DW卷积。 GConv虽然能够减少参数和计算量,但GConv中不同组之间的信息没有交流。为了解决这个问题,提出channel Shuffle的方法。在通过GConv之后,通过channel shuffle,取每个groups对应的通道数进行拼接,重新组成新的通道数。 def channel_shuffle(x: Tensor, groups: int) -> Tensor: batch_size