全局平均池化通过对特征图的每个通道(Channel)的所有像素值求平均,将高维特征图转换为低维向量。例如,输入特征图尺寸为 7 \times 7 \times 512 时,GAP会计算每个通道的均值,输出一个长度为512的一维向量。数学上,若特征图为 H \times W \times C,则输出为 C 个标量值,每个值对应一个通道的平均值。
减少参数与过拟合:相比全连接层,GAP无需额外参数,显著降低模型复杂度,从而减少过拟合风险。
适应不同输入尺寸:GAP直接对整个特征图操作,无需固定尺寸,适用于图像分类、目标检测等任务中输入尺寸变化的情况。
保留全局特征:通过整合通道内所有像素信息,GAP能捕捉特征图的全局上下文,增强模型对输入的整体表达能力。
图像分类:如ResNet、Inception等网络在最后阶段用GAP替代全连接层,直接输出分类结果。
目标检测与分割:结合ROI Pooling等技术,用于提取区域特征并进行定位或分割。
迁移学习:预训练模型(如ResNet)的GAP层可作为特征提取器,微调时仅需调整分类层