hourglass网络分析:网络输出值是什么

本文详细解析了DataLoader的三个输出值:输入图片x、关键点的heatmap及关键点位置坐标gt。通过可视化展示,帮助理解关键点检测过程。

DataLoder主要有返回一下三个值:

 return x, heatmaps, gt

解释一下这三个值,第一个x就是输入的图片,大小是96*96
在这里插入图片描述
可视化是这个样子:
在这里插入图片描述

第二值,就是各个关键点的heatmap,大小是159696,因为这里是预测15个脸部关键点。
直接对15张图拼接在一起可以看到如下图:

在这里插入图片描述在这里插入图片描述
如果讲其中一张和原图加在一起就可以看到:
在这里插入图片描述

其中眼睛部分的矩阵具体值如下所示:
在这里插入图片描述

第三个值gt,最简单,就是关键点的位置坐标。这个数据集一般都会提供。

在这里插入图片描述
在这里插入图片描述

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值