用ImageNet的数据集训练Faster R-CNN

本文总结了使用ImageNet数据集训练Faster R-CNN时遇到的问题,包括宽高比限制、图片大小要求及XML文件处理。提供了MATLAB代码筛选XML,调整边界框坐标,以及修改相关文件避免训练错误的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用ImageNet的数据集训练Faster R-CNN问题汇总

     一 有些xml文件有问题,需要修改
  二  object的长宽比有要求,否则训练过程中报错

         anchor_target_layer.py”, line 137, in forward 
         gt_argmax_overlaps = overlaps.argmax(axis=0) 
         ValueError: attempt to get argmax of an empty sequence

    

    object的bounding box的宽高比:

        VOC2007:在0.117-15.500之间

        ImageNet(ILSVRC2014):在0.03-48.50之间

    把数据的宽高比至少约束在0.117-15.500才能保证训练

三 对图片的大小也有要求,不能太小


解决方法:

        1.不是所有图片都有xml,所以我先根据Imagenet 数据集中bbox_train_v2中的xml文件把对应的图片复制出来。下面是matlab代码

%根据xml(在多个文件夹下)的名字找到该图片,保存这个图片
clc;
clear;

maindir = '/media/zc/A/Imagenet2012/bbox_train_v2'; %标签路径
maindir2 = '/media/zc/A/Imagenet2012/img_train';  %图片路径
a =
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值