Faster-Rcnn训练出现的问题

最新推荐文章于 2025-05-17 11:37:33 发布

空山明月_Blog

最新推荐文章于 2025-05-17 11:37:33 发布

阅读量5.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：图像处理与模式识别机器学习与深度学习

本文链接：https://blog.youkuaiyun.com/xiongchao99/article/details/78917050

机器学习与深度学习同时被 2 个专栏收录

28 篇文章

订阅专栏

图像处理与模式识别

24 篇文章

订阅专栏

本文总结了在Ubuntu环境下使用fasterrcnn进行训练时常见的错误及其解决方案，包括目标种类不匹配、图片尺寸不符等问题，并提供了调整迭代次数以缩短训练时间的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

以下问题是在Ubuntu下用faster rcnn(caffe与matlab)训练时所遇到的，我的解决方法不见得对其他人都使用：

1、错误使用 containers.Map/values，此容器中不存在指定的键。出错 roidb_from_voc>attach_proposals (line 172)

gt_classes = class_to_id.values({voc_rec.objects(valid_objects).class})

答：你标注的目标种类与datasets/VOCdevkit2007/VOCcode/VOC2007/VOCiniy.m中指定的目标种类不匹配。比如你只在VOCinit.m中写了一个目标类型标签‘car'，但你标记结果Annotations/中某个.xml中不小心标注两种对象object如'car'和'person’。这样机会报错，解决方法是重新标记那个.xml对应的图片，去掉多余的目标种类。

2、错误使用 proposal_prepare_image_roidb>scale_rois (line 110)，两个输入数组的非单一维度必须相互匹配。

答：可能有如下原因：

①一是要识别的是plane并且标注的xml文件中目标名称也是plane，但VOCinit.m中写的目标类型标签是‘car'，两者不匹配所以出问题，将VOCinit.m中的label改为'plane'即可；

②二是图片有问题，不是指.jpg或.png图片格式的问题，而是指图片本身存在问题。我是原因是：图片尺寸有问题，一般要求500*375或375*500，例如标准VOC数据集中基本都是这两种大小或者接近这两种大小的图片。我从百度图片上拷贝下来的图片尺寸千差万别，没有对尺寸进行修正直接训练，所以出错。

③可能是Annotations/中的xml文件文字格式有问题，我开始使用labelImg标注训练没问题，后来因为需要对xml文件内容做一定修改，就编写了一个matlab程序对所有的xml批量修改，然后就出错了。原因是修改后：紧凑型xml变为常规型，是的读取时多了几个空格节点。具体表现如下：

1°、xml开头多了一个xml声明格式语句：<?xml version="1.0" encoding="utf-8"?>；

2°、因为上述1中开头的格式设置，修改后的xml每行之间的空格也变大了。

这些用MATLAB打开可以看到，如下：

有问题的格式：