解决faster-rcnn中训练时assert（boxes[:,2]＞=boxes[:,0]）.all()的问题

最新推荐文章于 2024-04-16 17:32:48 发布

原创最新推荐文章于 2024-04-16 17:32:48 发布 · 295 阅读

1 ·

CC 4.0 BY-SA版权

本文介绍了一种在目标检测任务中处理翻转图像时边界框坐标异常的方法。通过修改lib/datasets/imdb.py文件中的append_flipped_images()函数，加入对翻转后边界框坐标的检查与修正，确保所有边界框正确表示物体位置。

修改lib/datasets/imdb.py，append_flipped_images()函数
数据整理，在一行代码为 boxes[:, 2] = widths[i] - oldx1 - 1下加入代码：
for b in range(len(boxes)):
if boxes[b][2]< boxes[b][0]:
boxes[b][0] = 0

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

程序员阿明

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

解决assert（boxes[:,2]>=boxes[:,0]）.all()报错

ptgood的博客

02-15

2690

写这篇主要是写了代码不想浪费用的是github上的tf-faster-rcnn（自己搜下） python3.6.2版本错误：assert（boxes[:,2]>=boxes[:,0]）.all(): boxes是标注的bounding box,检查Xmax是否大于Xmin,只要有一个不符合就报错 ====================== 问题原因：1.数据集有问题2.数据...

解决faster-rcnn中训练时assert（boxes[:,2]>=boxes[:,0]）.all()的问题

喵喵

06-11

1966

问题：在用py-faster-rcnn进行训练时出现 “assert（boxes[:,2]>=boxes[:,0]）.all()“ 报错提示原因：目标框坐标溢出范围，如标注的目标从左上角开始即坐标可能为0，而在源代码中会对坐标进行减1，导致出错解决方法：方法1： a::修改lib/datasets/imdb.py，append_flipped_images()函数数据整理

参与评论您还未登录，请先登录后发表或查看评论

assert (boxes[:, 2] >= boxes[:, 0]).all()报错

weixin_30619101的博客

05-21

455

根据报错信息，打印以下内容：代码如下： for i in xrange(num_images): #print ('in append_flipped==================',self.roidb) boxes = self.roidb[i]['boxes'].copy() oldx1 = boxes[:, 0].copy() oldx2 = bo...

faster rcnn:assert (boxes[:, 2] >= boxes[:, 0]).all()分析塈VOC2007 xml坐标定义理解

10km的专栏

03-22

8628

在进行faster rcnn训练的时候，报了一个断言错误 File “/py-faster-rcnn/tools/../lib/datasets/imdb.py”, line 108, in append_flipped_images assert (boxes[:, 2] &amp;amp;amp;gt;= boxes[:, 0]).all() AssertionError 参照这篇文章，找到了解决办法

DETR类模型训练报错assert (boxes1[:, 2:] ＞= boxes1[:, :2]).all()

qq_20793791的博客

10-18

1428

关闭混合精度训练，即在训练中让amp=False，为了让自己的batch size大一些，魔改了作者的代码，结果最后是这里出了问题，估计是FP16精度不够溢出了。：一个另外的问题时当时想在模型报错的时候打印box的结果，但是终端什么东西都没有，可能是多进程的原因，解决方案为报错时写入log文件而不是print()：在多卡模型训练时碰到了这个问题，github给出的解决方案五花八门，有降低学习率的，有人num_classes写错了的，但是都不行。：代码断言错误，模型预测结果的box输出为NaN。

faster-rcnn系列assert (boxes[:, 2] >= boxes[:, 0]).all()和loss偶尔为nan的问题

律己且好学，才能保证不坠入愤世嫉俗之列。

05-08

412

这个问题是发生在用自己的数据训练faster rcnn的时候~ 问题： File "/py-faster-rcnn/tools/../lib/datasets/imdb.py", line 108, in append_flipped_images assert (boxes[:, 2] >= boxes[:, 0]).all() AssertionError 分析：可能是自己的...

[报错]Faster R-CNN：assert (boxes[:, 2] >= boxes[:, 0]).all()问题

tanshuai0620的博客

11-07

385

记录一下~ 最近在给Faster R-CNN换数据集运行，win10版本的，出现了assert (boxes[:, 2] >= boxes[:, 0]).all()问题。出现这个报错除了修改是否-1的问题，如下图： bbox = obj.find('bndbox') # Make pixel indexes 0-based x1 = float(bbox.find('xmin').text...

（linux）Faster RCNN-pytorch1.0目标检测2：训练自己的数据集，gpu，pycharm, 训练笔记

chao_xy的博客

03-11

885

（linux）Faster RCNN-pytorch1.0目标检测2：训练自己的数据集，gpu，pycharm, RTX2080ti，训练笔记。报错ImportError: cannot import name '_mask '解决在最后

运行Faster-RCNN-TensorFlow-Python3.5的train.py文件出现 assert (boxes[:, 2] >= boxes[:, 0]).all()错误

kelly若的博客

06-25

809

参考这篇文章：https://blog.csdn.net/10km/article/details/64641322 我觉得我的xml文件不需要将矩形框都减1，所以在-1前面都加一个井号，将-1都注释掉。错误：File "/home/drl/new/Faster-RCNN-TensorFlow-Python3.5/lib/datasets/imdb.py", line 119, in appen...

assert (boxes[:, 2] >= boxes[:, 0])错误解决方法

zhuangweizhong2201的博客

12-12

3696

assert (boxes[:, 2] >= boxes[:, 0])错误解决方法可能出现的问题点： 1. xml的bndbox尺度有问题 xmin比xmax大，ymin比ymax大，或者根本没有bndbox属性。解决方法：脚本遍历xml目录进行检查，找出问题xml并改正。 2.xml的bndbox值可能为0 代码中做了-1的操作： datasets下pascal_voc.py 173-...

faster R-CNN 模型解析（torchvision版）

孙永杰的博客

01-06

3171

torchvision中已经为我们实现好了faster R-CNN模型，我们只需要调用即可。本文将对该模型做进一步的分析，使自己能够在使用过程中更加得心应手。

RuntimeError: CUDA error: device-side assert triggered 解决方法

JackHu12345的博客

12-04

2283

使用fp16的时候，容易报上面的错误解决方法：（1）检查自己的代码实现，数组是否越界 BCELoss之前有没有转到0~1之间（2）这个通常是产生了nan导致数组越界，可以通过如下方式定位nan出现的位置： with torch.autograd.detect_anomaly(): loss.backward() 一般来说是分母为0或者exp的值过大导致的来自mmdetection的isue下大佬的点评，方便debug （3）实现上提高数值稳定性容易出现0**0的

RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronously re

m0_45924886的博客

04-16

4475

检测头的输出和类别数量不匹配，比如我用的VOC数据集这里应该是20个类，所以会出现上面错误，因此只要清除你的类别数量修改成正确的就OK。出现该错误的原因是维度不匹配，也就是roi_heads阶段，如果你没有修改模型和数据读取，基本上可以断定是类别数量出错：看如下。

faster rcnn接口_源码解析faster rcnn （mask rcnn）全过程

weixin_33711871的博客

02-01

1271

1. 总领过程--官方faster cnnn 调用过程import torchvision, torch# 导入官方faster rcnn 模型model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=False)# For training# 生成随机训练数据，用于测试模型跑通boxes = torch.ran...

Faster RCNN 训练自己的检测模型

热门推荐

marshb11的专栏

01-03

1万+

一、准备自己的训练数据根据pascal VOC 2007的训练数据集基本架构，第一步，当然是要准备自己的训练图片集，本文直接将自己的准备的图片集（.jpg）扔到如下文件夹下： $(py-faster-rcnn)/data/VOCdevkit2007/VOC2007/JPEGImages第二步，根据上述自己的要训练检测的物体图片集，标注相应的.xml文件(我是自己写了一个简单的矩形框标注工具，生成相应

box[:, [0,2]] = box[:, [0,2]]*nw/iw + dx IndexError: too many indices for array

Lehi_Chiang的博客

02-06

1580

box[:, [0,2]] = box[:, [0,2]]*nw/iw + dx IndexError: too many indices for array 关于Keras实现yolo v3的数据集错误在文件夹的根目录中，运行voc_annotation.py文件会生成yolo格式对应的数据集格式，生成2007_train,2007_val,2007_trainval三个文件。但是我在没有...

pytorch SSD代码解读（2）

方悔读书迟

08-07

1245

一、预测过程 letterbox_image为了防止失帧，不进行简单的resize，先放大图片，进行三次样条插值，创建一个300*300的灰色图片，把放大后的图片粘贴到灰色图片上，相当于在边缘加上灰条。 def letterbox_image(image, size): iw, ih = image.size w, h = size scale = min(w/iw, h/ih) nw = int(iw*scale) # nw,nh一定有一个是300 nh = in

最新发布

12-09

你遇到的错误是： ``` AssertionError: Anchors should be Tuple[Tuple[int]] because each feature map could potentially have different sizes and aspect ratios. There needs to be a match between the number of feature maps passed and the number of sizes / aspect ratios specified. ``` ### 🔍 错误原因分析这个错误来自 `torchvision` 的 `AnchorGenerator` 类。你的锚框设置如下： ```python anchor_sizes = ((16, 32, 64),) aspect_ratios = ((0.5, 1.0, 2.0),) * len(anchor_sizes) ``` 虽然语法上看似正确，但问题在于： - `resnet_fpn_backbone('resnet50', pretrained=True)` 输出 **5 层特征图**（C2, C3, C4, C5, P6？不，FPN 通常是 P2-P5 或 C3-C5 + FPN 输出）。 - 实际上，ResNet-FPN 返回的是一个包含多个尺度的特征字典（通常为 `"0"`, `"1"`, `"2"`, `"3"`, `"pool"`），而 `AnchorGenerator` 默认会为每一个特征层生成锚点。 - 但是你只给了一组 `anchor_sizes`（即 `(16, 32, 64)`），它会被广播成所有层级使用这一组大小 —— 这没问题。然而，真正的问题是：**`anchor_sizes` 和 `aspect_ratios` 必须是一个与输出特征层数量完全匹配的嵌套元组结构**。 FPN 在 Faster R-CNN 中默认有 **5 个空间分辨率不同的特征层**（对应于 `P2`, `P3`, `P4`, `P5`, `P6` 不一定都有；实际是来自 C3 到 C5 上构造的 FPN 特征层，共 5 层？其实标准是 5 层？我们来确认一下）。实际上，在 `torchvision` 中，`resnet_fpn_backbone` 构建的 FPN 通常输出 **5 个特征层**（key 为 `'0'`, `'1'`, `'2'`, `'3'`, `'pool'`），但用于 RPN 的一般是前 5 层或其中 4~5 层。而 `AnchorGenerator` 要求： > `sizes` 和 `aspect_ratios` 都必须是长度等于特征层数的 tuple，每一项是一组 (size,) 或 (ar,)。 --- ## ✅ 正确解决方案你需要将 `anchor_sizes` 和 `aspect_ratios` 设置为 **每个特征层都有一组 anchor size**。 ### ✅ 修改方式如下： ```python # 假设有 5 个特征层（这是 ResNet-FPN 的常见情况） # 每一层使用相同的 anchor 大小组合，但要显式地写成 5 个 tuple anchor_sizes = ( (16,), # P2 (32,), # P3 (64,), # P4 (128,), # P5 (256,), # P6 (如果存在) ) # 或者更合理的小目标检测设计：多尺度 small anchors anchor_sizes = tuple((s,) for s in [16, 32, 64, 128, 256]) # 每层一个基础尺寸 aspect_ratios = ((0.5, 1.0, 2.0),) * len(anchor_sizes) # 每层都用这三个比例 ``` 然后创建 `AnchorGenerator`： ```python anchor_generator = AnchorGenerator(sizes=anchor_sizes, aspect_ratios=aspect_ratios) ``` 这样就能通过类型和维度检查了。 --- ### 🛠️ 完整修正代码段（替换原模型构建部分） ```python # 使用 ResNet50 + FPN 主干网络 backbone = resnet_fpn_backbone('resnet50', pretrained=True) # 自定义 Anchor Generator，适配 5 个特征层 # 更适合小目标检测：底层（P2/P3）用更小的 anchor anchor_sizes = ( (16,), # P2 (high resolution, small objects) (32,), # P3 (64,), # P4 (128,), # P5 (256,), # P6 ) aspect_ratios = ((0.5, 1.0, 2.0),) * 5 # 每层三个比例 anchor_generator = AnchorGenerator(sizes=anchor_sizes, aspect_ratios=aspect_ratios) # 创建 Faster R-CNN 模型 model = FasterRCNN( backbone=backbone, num_classes=num_classes, rpn_anchor_generator=anchor_generator, min_size=640, max_size=640, box_nms_thresh=0.5, box_score_thresh=0.05, ) ``` --- ### 💡 补充说明 1. **为什么之前 `( (16,32,64), )` 不行？** 因为你传的是 `((16,32,64),)` —— 一个只有一个元素的 tuple，每个元素是一个 tuple。这表示“只有 1 层特征图”，但实际你有 5 层 → 维度不匹配！ 2. **如何知道有多少特征层？** 可以打印看看： ```python from torchvision.models.detection.backbone_utils import resnet_fpn_backbone import torch backbone = resnet_fpn_backbone('resnet50', pretrained=False) x = torch.randn(1, 3, 640, 640) features = backbone(x) print("Feature keys:", list(features.keys())) # 应该是 ['0', '1', '2', '3', 'pool'] print("Number of feature levels:", len(features)) ``` 输出一般是： ``` Feature keys: ['0', '1', '2', '3', 'pool'] Number of feature levels: 5 ``` 所以你需要 **5 组 anchor sizes**。 3. **关于小目标建议优化** - 如果专注小目标，可以在浅层（如 P2/P3）加入更小的 anchor，比如 `(8,)`、`(16,)` - 示例： ```python anchor_sizes = ( (8,), # P2 - very small (16,), # P3 - small (32,), # P4 - medium (64,), # P5 - large (128,), # P6 - very large ) ``` --- ### ✅ 总结修复步骤 | 问题 | 解决方法 | |------|---------| | AnchorGenerator 断言失败 | 显式提供与特征层数一致的 `sizes` 元组 | | 少写了层级数量 | 改为 `tuple((s,) for s in [...])`，共 5 层 | | 小目标表现差 | 浅层加小 anchor，如 8x8 | --- ### ✅ 最终推荐配置（适合小目标） ```python anchor_sizes = ( (8,), # P2 (16,), # P3 (32,), # P4 (64,), # P5 (128,), # P6 ) aspect_ratios = ((0.5, 1.0, 2.0),) * 5 # 每层保持三种形状 anchor_generator = AnchorGenerator(sizes=anchor_sizes, aspect_ratios=aspect_ratios) ``` --- ### ✅ 附加建议：警告处理（非致命）你看到这些警告也可以顺手改掉： ```bash UserWarning: Using 'backbone_name' as positional parameter(s) is deprecated since 0.13 ... ``` 改为关键字调用： ```python backbone = resnet_fpn_backbone(backbone_name='resnet50', pretrained=True) ``` 或者更好（新版本推荐）： ```python import torchvision.models as models # 替代方案：直接用预训练主干 weights = models.ResNet50_Weights.IMAGENET1K_V1 backbone = resnet_fpn_backbone('resnet50', weights=weights) ``` --- 现在你可以运行训练了，不会再出现 `AssertionError`。 ---