Question about center & scale

最新推荐文章于 2022-03-16 15:52:54 发布

原创最新推荐文章于 2022-03-16 15:52:54 发布 · 384 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文探讨了人体姿态估计任务中图像裁剪的方法，包括如何设置裁剪区域的中心和比例，确保人物居中并占据约70-80%的高度。还讨论了针对截断或部分可见人物的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://github.com/umich-vl/pose-hg-demo/issues/8

我的建议是将“center”设置为边界框的中心（足够简单），然后对于“scale”，你需要稍微玩一下。使用框的最大尺寸（高度或宽度）并除以常数因子。我不能说我的头脑是多么好的价值，但要玩代码。您可以调用裁剪并显示生成的图像。理想情况下，站立的人应居中并占据图像高度的约70-80％。

方框的主要问题是很难判断数字是否被截断，并且您可能会看到只有身体上半部分可见的数字表现不佳。在这种情况下，可以尝试根据盒子的纵横比调整中心和比例。最终，特别依赖于这些中心和规模术语的训练极限之一是很难直接推广到边界框，但我认为你仍然应该能够产生合理的预测。

博客等级

码龄8年

338
原创

825
点赞

3749
收藏

239
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 多人的人体姿态估计参考文献

下一篇：: 学习pytorch代码学习的整理

最新评论

模型微调
Chen_max_fa: 对过程忽略不谈是你可的，懂的人不用看，不懂得人看不懂。例如结合ResNet，保存预训练模型得哪些参数，冻结哪些参数。等等，相关介绍一下且不是更好？
Dite-HRNet: Dynamic Lightweight High-Resolution Network for Human PoseEstimation
zcy8578: 您好，可以给一下代码运行图吗，没跑出来，着急用
为整数线性规划(integer linear programming,ILP)
Zaylie: 1.5万+的访问量是什么鬼
torch.argmax中dim详解
做个铁憨憨537: a是两个3×4的数组，a.shape = torch.Size([2, 3, 4]) ①若b = torch.argmax(a, dim=0)，则a在第一个维度上作比较，也就是a[0][x][y]与a[1][x][y]比较，前者大，取第一维的索引0，后者大取第二维的索引1，因为x取0，1，2，y取0，1，2，3，所以最后的结果是一个3×4的数组，此数组由a的第一维的所有索引，也就是0和1组成； ②若b = torch.argmax(a, dim=1)，则a在第二个维度上作比较，也就是a[x][0][y]、a[x][1][y]、a[x][2][y]三者比较，哪个大取哪个的索引，因为x可取0，1，y可取0，1，2，3，所以结果是一个2×4的数组，此数组完全由第二维的索引组成； ③若b = torch.argmax(a, dim=2)，则a在第三个维度上作比较，也就是a[x][y][0]、a[x][y][1]、a[x][y][2]、a[x][y][3]三者比较，哪个大取哪个的索引，因为x可取0，1，y可取0，1，2，所以结果是一个2×3的数组，此数组完全由第三维的索引组成。
关于建立Lite-HRNet实验环境的问题
zouxiaolv: deep learinng human pose estimation 代码里面有

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。