2D人体姿态估计 - Stakced Hourglass Network（SHN）个人理解

原创

已于 2022-06-29 10:24:40 修改 · 2k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #神经网络

于 2022-05-17 09:29:08 首次发布

本文介绍了残差网络（ResNets）及其核心组件——残差块，用于解决深度神经网络训练中的梯度消失问题。接着，详细阐述了Hourglass网络结构，包括其编码解码器设计、残差模块和跳跃连接的作用。Hourglass网络通过先降采样后升采样的方式捕获不同尺度的特征，并在不同尺度间进行信息交换。堆叠沙漏网络（StackedHourglassNetworks）通过多层Hourglass模块实现多层次特征提取，利用中间监督学习提升预测精度。此网络结构在人体关键点检测任务中表现出色，能够进行反复的自上而下和自下而上的推断，从而优化预测结果。

Stacked Hourglass Networks for Human Pose Estimation

中文翻译

An Intuitive Explanation of Convolutional Neural Networks – the data science blog

【https://github.com/princeton-vl/pytorch_stacked_hourglass】

一、残差网络(ResNets)与残差块（Residual block）

非常深的神经网络是很难训练的，因为存在梯度消失和梯度爆炸问题。跳跃连接（Skip connection）可以从某一层网络层获取激活，然后迅速反馈给另外一层，甚至是神经网络的更深层。利用跳跃连接构建能够训练深度网络的ResNets，有时深度能够超过100层。ResNets是由残差块（Residual block）构建的.