关键点检测网络HR-Net数据集制作过程的理解

最新推荐文章于 2024-08-27 10:02:38 发布

原创最新推荐文章于 2024-08-27 10:02:38 发布 · 2.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

关键点定位专栏收录该内容

1 篇文章

订阅专栏

本文介绍了在项目中使用HR-Net进行关键点定位的过程，特别是如何将网络结构应用于自定义数据集。作者详细阐述了从face300w的csv文件格式制作数据集的方法，包括scale、center_w和center_h参数的计算，并解释了200这个系数的含义。在transform.py中调整该系数以适应不同数据集的尺寸。

部署运行你感兴趣的模型镜像

项目中需要对关键点定位，CPM网络和HR-Net对于这个目标表现都不错，现在着重说一下HR-Net在替换成自己数据集的过程中出现的一点疑惑，通过GitHub issue和计算解决的过程。

首先给出使用的GitHub链接。

网络结构如图所示：

可以发现，网络在进行一系列卷积并行后最后合并成相同尺寸的特征图，也就是会形成最终的Heatmap。在制作数据集时，使用的时face300w的csv文件格式，截取部分大概长这个样：

可以发现，前面有三个系数，分别是scale, center_w,centrer_h, 理解后面两个比较简单，就是可以定位到人脸的中间部分，然后猜测第一个scale的参数应该就是找到中心点了，然后通过一个缩放系数就能crop到脸部的区域用于训练。GitHub中解释了这个问题，我也验证了一下，

比如对于路径下的afw/397921011_2.jpg文件，缩放比例，中心宽高分别为 1.595 506.5 662.5 第一个关键点的坐标为1280 960，然后将所有关键点的x，y坐标的最大值最小值找出来为x1, x2, y1, y2，通过公式：

scale = max(w, h) / 200
center_w = (x1 + x2) / 2
center_h = (y1 + y2) / 2

即可求的。

相应的，这里系数为什么是200呢，其实就是一个系数，根据人脸大小和数据集设定的，也可以改成自己的数据集大小的。在transform.py中也可以找到这个参数。

sf = scale * 200.0 / output_size[0]

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言

AI算力推荐

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言

音乐合成

ACE-Step

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。