在做深度学习yolov3目标检测训练时,通常需要对原始图片做resize,把图片的尺寸缩放416x416。然而,opencv提供的resize函数里有多种插值方式,最常见使用的是INTER_LINEAR(双线性插值)和INTER_NEAREST(最近邻插值)。在github上pytorch版本的yolov3的star数量最多的的是https://github.com/ultralytics/yolov3和https://github.com/eriklindernoren/PyTorch-YOLOv3这两个,分别打开这两个工程,找到它们的图象预处理resize函数。可以看到,在https://github.com/ultralytics/yolov3工程里,对图片resize是在utils/datasets.py文件的letterbox函数里,代码片段是:
![]()
看后面的注释说INTER_AREA是最好的,INTER_LINEAR是最快的,并且letterbox函数的输入参数interp默认是INTER_AREA。而在https://github.com/eriklindernoren/PyTorch-YOLOv3/blob/master/utils/datasets.py工程里,对图片resize依然是在utils/datasets.py文件里,代码片段是:

探讨YoloV3目标检测训练中图片resize至416x416的插值方式选择,对比INTER_AREA、INTER_LINEAR和INTER_NEAREST的效果及差异。
最低0.47元/天 解锁文章
5271

被折叠的 条评论
为什么被折叠?



