动手学深度学习10:汇聚层(pooling)
通常当我们处理图像时,我们希望逐渐降低隐藏表示的空间分辨率、聚集信息,这样随着我们在神经网络中层叠的上升,每个神经元对其敏感的感受野(输入)就越大。
而我们的机器学习任务通常会跟全局图像的问题有关(例如,“图像是否包含一只猫呢?”),所以我们最后一层的神经元应该对整个输入的全局敏感。通过逐渐聚合信息,生成越来越粗糙的映射,最终实现学习全局表示的目标,同时将卷积图层的所有优势保留在中间层。
除此之外,汇聚层海可以降低卷积层对位置的敏感性,使得模型具有更好的鲁棒性。
最大汇聚层和平均汇聚层

汇聚窗口形状为p×qp \times qp×q的汇聚层称为p×qp \times qp×q汇聚层,汇聚操作称为p×qp \times qp×

汇聚层在神经网络中用于降低图像特征的空间分辨率,通过最大值或平均值池化来聚集信息,增强模型对位置的不敏感性和全局表示能力。最大汇聚层输出窗口的最大值,平均汇聚层则输出平均值。汇聚层的步幅和填充可以调整,且输出通道数与输入通道数相同。
最低0.47元/天 解锁文章
36万+

被折叠的 条评论
为什么被折叠?



