关于skip connection位置特征增强模块的通道降维策略的比较
在Camouflaged Object Detection (COD) 或其他语义分割任务中,skip connection 位置的特征增强模块的通道降维策略主要有两种方式:
-
方式 A:先保持输入输出通道数一致,之后再降维
- 例如
CoordAtt()
这类模块,输入输出通道数与feature extractor
提取的原始特征通道数相同,然后在后续利用1x1
卷积或其他操作进行降维。
- 例如
-
方式 B:直接将输出通道降维(例如到64或128)
- 例如,一些模型会直接在skip connection增强模块中降维,将输出通道数固定为 64 或 128,而不是保持与输入通道一致。
这两种方式的主要区别在于:
方式 | 优势 | 劣势 |
---|---|---|
方式 A 先保持通道数一致,后降维 | 保持更多的特征信息:先经过注意力或其他特征增强操作后再降维,保留更多局部信息。 更容易集成不同通道数的特征,在特征融合时更加灵活。 |
计算量较大:由于skip connection的通道数较高,会增加计算量, |