目标检测——RCNN之建议框padding

最新推荐文章于 2024-07-08 15:56:38 发布

原创

最新推荐文章于 2024-07-08 15:56:38 发布 · 3.2k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

博客详细介绍了在RCNN目标检测过程中，如何进行建议框的context padding，澄清了原论文中关于resize图片的疑惑。作者通过研究`rcnn_create_model.m`, `rcnn_extract_regions.m`, `rcnn_im_crop.m`三个文件，发现padding并非简单的等距扩大16像素，而是基于图像长宽比进行，以保持形状不变。同时提到了各向同性和各向异性变形的概念，并推荐了一篇相关文章进行深入理解。" 136089646,8269512,前后端交互实现分页功能设计解析,"['前端开发', '后端开发', '数据库']

在学习RCNN的过程中，一直搞不明白resize 227*227这个步骤之前的context padding（建议框padding）这个步骤是怎么进行的，因为发现原论文中最后得到的resize图片（下图 a中红框）跟我所理解得到的resize图片不太相符，

图 a

我所理解的padding后的图片，应该是上下左右都等距地扩大16个像素值，但是从图a中红框可以看出原文并没有进行等距地扩大16个像素，所以百思不得其解，在google各种问题，查看各种网址，最终在源代码中找到了答案，分别查看：

1. rcnn_create_model.m

2.rcnn_extract_regions.m

3.rcnn_im_crop.m

这3个文件发现：虽然文中说是padding 16个像素值，但是却是在保持长宽比的基础上进行padding，也就是说如果一幅影像的长宽比不是1:1的话，那么建议框的扩大也不是按照1:1进行。

对于文中出现的各向同性变形以及各向异性变形，可以参考这篇文章：

https://www.jianshu.com/p/3a0a0e5a26a1

终于可以睡觉了～各位早安，晚安～

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。