学习Faster R-CNN代码roi_crop（四）

最新推荐文章于 2025-04-18 00:49:23 发布

YF-Zhang

最新推荐文章于 2025-04-18 00:49:23 发布

阅读量1.5k

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： faster rcnn roi_crop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43872578/article/details/87897857

PyTorch 专栏收录该内容

13 篇文章

订阅专栏

本文探讨了在卷积神经网络(CNN)中处理不同尺寸输入图像的挑战，详细介绍了两种预处理方法：Crop(裁剪)和Warp(扭曲)。Crop通过截取原图的一部分来保持固定大小的输入，而Warp则将原图缩放至固定尺寸。这两种方法在保持CNN输入一致性的同时，也带来了物体截断或形状失真的潜在问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为什么要crop

‘嘟嘟_猪’在博客《faster-rcnn原理及相应概念解释》提到的

传统的CNN限制了输入必须固定大小（比如AlexNet是224x224），所以需要进行裁剪，在实际使用中往往需要对原图片进行crop或者warp的操作：

crop：截取原图片的一个固定大小的patch
warp：将原图片的ROI缩放到一个固定大小的patch

crop和warp都无法保证在不失真的情况下将图片传入到CNN当中：

crop：物体可能会产生截断，尤其是长宽比大的图片.
warp：物体被拉伸，失去“原形”，尤其是长宽比大的图片

(reference: https://www.cnblogs.com/dudumiaomiao/p/6560841.html)

【占坑，未完待续…】

博客等级

码龄7年

23
原创

19
点赞

90
收藏

21
粉丝

关注

私信

热门文章

分类专栏

python 2篇
PyTorch 13篇
Object detection 6篇

上一篇：: 学习Faster R-CNN代码roi_pooling（三）

下一篇：: 学习Faster R-CNN代码roi_align（五）

最新评论

复现YOLO
Stevezhangz: 老哥，复现不是指的模型搭建吗。哈哈哈
复现 faster rcnn
Tornado_Liao: 您好，想问下源码中c的部分在复现的时候是忽略的吗？那部分代码不太清楚作用是什么
学习Faster R-CNN代码roi_pooling（三）
hahajing369: 你好，pytorch实现的faster rcnn中，关于 roi_pooling/src/roi_pooling.c的C代码怎么调试呢？
学习Faster R-CNN代码rpn（六）
Hoppipolla0816: 博主，你好。请问rpn网络的输入——特征图的深度指的是有几张feature map的意思吗？
学习Faster R-CNN代码rpn（六）
KK_THREESTEP: 1.请问reshape是如何转的？我看到不是很明白 2.为什么需要将rpn_cls_score 转换为rpn_cls_score_reshape?

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。