SimpleHumanPose代码及原理分析(四)-- 算法原理总结

本文总结了SimpleHumanPose算法的关键点,包括backbone网络结构的ResNet与上卷积设计,利用高斯热力图处理关键点,以及loss函数的详细计算过程。通过实例解析展示了算法核心组件的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SimpleHumanPose代码及原理分析(四)-- 算法原理总结

在之前,对SimpleHumanPose算法的代码进行了解析:
SimpleHumanPose代码及原理分析(一)-- coco keypoints数据集
SimpleHumanPose代码及原理分析(二)-- data与label前处理
SimpleHumanPose代码及原理分析(三)-- loss损失函数
这篇blog对SimpleHumanPose算法进行一个总结和归纳~~

一、backbone网络结构

在这里插入图片描述
上图就是SimpleHumanPose的网络结构~可以看到,其实backbone很简单,就是单纯的high-to-low resolution网络从高分辨输入中获得低分辨特征图,然后再从低分辨特征图上恢复高分辨率特征图。这里,在进行high-to-low阶段中,backbone为resnet,图片从256的shape一直进行下卷积到16。在low-to-high阶段中,通过上卷积(SimpleHumanPose的核心,并没有沿用其他传统模型的上采样)恢复feature map的shape为64。

二、heatmap生成

针对于label的处理,采用的是高斯热力图的方法。
举个栗子~
比如说,label中有一个点的坐标为(32,32),而SimpleHumanPose生成的heatmap的shape为64 * 64的,所以说这个点可以看作是中心点。
在这里插入图片描述
在这里插入图片描述
大致的图片基于上图所示。

三、loss函数

进行loss计算的两条线分别为:
第一条线:(256,256)的data经过网络输出得到(64,64)
第二条线:label生成的(64,64)热力图
采用loss就是针对这64*64=4096个点分别进行L2损失函数(即均方差函数)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

进我的收藏吃灰吧~~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值