DataLoder主要有返回一下三个值:
return x, heatmaps, gt
解释一下这三个值,第一个x就是输入的图片,大小是96*96

可视化是这个样子:

第二值,就是各个关键点的heatmap,大小是159696,因为这里是预测15个脸部关键点。
直接对15张图拼接在一起可以看到如下图:


如果讲其中一张和原图加在一起就可以看到:

其中眼睛部分的矩阵具体值如下所示:

第三个值gt,最简单,就是关键点的位置坐标。这个数据集一般都会提供。


本文详细解析了DataLoader的三个输出值:输入图片x、关键点的heatmap及关键点位置坐标gt。通过可视化展示,帮助理解关键点检测过程。
DataLoder主要有返回一下三个值:
return x, heatmaps, gt
解释一下这三个值,第一个x就是输入的图片,大小是96*96

可视化是这个样子:

第二值,就是各个关键点的heatmap,大小是159696,因为这里是预测15个脸部关键点。
直接对15张图拼接在一起可以看到如下图:


如果讲其中一张和原图加在一起就可以看到:

其中眼睛部分的矩阵具体值如下所示:

第三个值gt,最简单,就是关键点的位置坐标。这个数据集一般都会提供。


863
1286