介绍
HRNet(High-Resolution Network) 是一种用于视觉任务(如姿态估计、语义分割、目标检测等)的深度神经网络架构。其设计的核心思想是从头到尾保持高分辨率特征表示,以提升空间精度和语义表达能力。与传统卷积神经网络(如 ResNet、U-Net)不同,HRNet 在整个网络过程中始终保持高分辨率特征流,而不是通过下采样再上采样的方式恢复分辨率。
创新点
并行高低分辨率流
HRNet 从一个高分辨率的卷积流开始,在后续阶段逐步加入低分辨率的卷积流。各个分辨率的卷积流是并行连接的,而不是串联连接。
多分辨率融合
在各个阶段中,HRNet 通过重复的信息交换模块(多分辨率融合模块)将不同分辨率的特征进行融合。这一模块在多个残差单元后重复多次,以提升高分辨率表示的语义丰富度和空间精度。
从头到尾保持高分辨率
网络架构
图 3 将 HRNet 的整个 backbone 部分进行了拆解,划分为多个阶段及各阶段之间的过渡处