【代码】NMS

本文详细解析了FastR-CNN中使用的非极大值抑制(NMS)算法,通过Python实现,介绍了如何计算边界框的交并比(IOU),并展示了NMS算法的具体流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# --------------------------------------------------------
# Fast R-CNN
# Copyright (c) 2015 Microsoft
# Licensed under The MIT License [see LICENSE for details]
# Written by Ross Girshick
# --------------------------------------------------------

import numpy as np

def py_cpu_nms(dets, thresh):
    """Pure Python NMS baseline."""
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    order = scores.argsort()[::-1]

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1]

    return keep

以上为代码。下面说说它是怎么来的。

假设det1为[a1, b1, a2, b2], det2为[x1, y1, x2, y2],我们要求他们的交和并。

det1的集合表示为{(x, y) | a1 < x < a2, b1 < y < b2},det2 = {(x, y) | x1 < x < x2, y1 < y < y2}

求交

求两个集合的交Int = {(x, y) | a1 < x < a2 且 b1 < y < b2 x1 < x < x2 且 y1 < y < y2} 

                            = {(x, y) | a1 < x < a2 且 x1 < x < x2 b1 < y < b2 且 y1 < y < y2} 

                            = {(x, y) | max(a1, x1) < x < min(a2, x2), max(b1, y1) < y < min(b2, y2)} 

其中要注意的是可能会出现max(a1, x1) > min(a2, x2)这种情况出现,这时Int为空集。

求并

两个集合的并不一定是矩形,但面积可以通过交来算出来

NMS

keep=[] 
score降序排列
    while(score不为空)
        A = score最大的det
        将其余det与A计算IOU
        删除IOU过小的det
        score中删除A
        keep中添加A
返回keep

 

### NMS算法的Python实现 非极大值抑制(Non-Maximum Suppression, NMS)是一种用于目标检测中的后处理技术,旨在消除冗余边界框并保留最可能的目标位置。以下是基于Python的一种常见NMS算法实现: ```python import numpy as np def non_max_suppression(boxes, scores, threshold): """ 实现非极大值抑制(NMS)。 参数: boxes (numpy.ndarray): 边界框数组,形状为 (n_boxes, 4),其中每一行表示[x_min, y_min, x_max, y_max]。 scores (numpy.ndarray): 每个边界框对应的置信度分数,形状为 (n_boxes,)。 threshold (float): IOU阈值,超过该阈值的边界框会被抑制。 返回: list: 经过NMS后的边界框索引列表。 """ # 如果没有盒子,则返回空列表 if len(boxes) == 0: return [] # 获取边界框坐标 x1 = boxes[:, 0] y1 = boxes[:, 1] x2 = boxes[:, 2] y2 = boxes[:, 3] # 计算每个边界的面积 areas = (x2 - x1 + 1) * (y2 - y1 + 1) # 对分数进行降序排列 order = scores.argsort()[::-1] keep = [] # 存储最终保留的边界框索引 while order.size > 0: i = order[0] # 当前最高分的边界框索引 keep.append(i) # 计算当前边界框与其他剩余边界框之间的交集区域 xx1 = np.maximum(x1[i], x1[order[1:]]) yy1 = np.maximum(y1[i], y1[order[1:]]) xx2 = np.minimum(x2[i], x2[order[1:]]) yy2 = np.minimum(y2[i], y2[order[1:]]) w = np.maximum(0.0, xx2 - xx1 + 1) h = np.maximum(0.0, yy2 - yy1 + 1) intersection = w * h # 计算IoU iou = intersection / (areas[i] + areas[order[1:]] - intersection) # 找到IoU小于阈值的边界框 indices = np.where(iou <= threshold)[0] # 更新顺序列表 order = order[indices + 1] return keep ``` 上述代码实现了经典的NMS方法[^3]。它通过计算重叠区域的比例(即IoU),筛选出具有高得分且不显著重叠的候选框。 ### 使用说明 - `boxes` 是一个二维数组,每行代表一个矩形框的位置 `[x_min, y_min, x_max, y_max]`。 - `scores` 表示对应于这些矩形框的概率或置信度评分。 - `threshold` 定义了一个 IoU 阈值,当两个框的 IoU 超过此阈值时,其中一个较低概率的框将被移除。 #### 关键点解释 - **IOU**: Intersection over Union 的缩写,衡量两矩形框之间重叠程度的一个指标[^4]。 - **排序**: 候选框按照其预测得分从大到小排序,优先考虑更可信的结果。 - **迭代删除**: 在每次循环中选出当前最佳候选项,并将其余与其高度重合的部分剔除。 ### C++版本的伪代码示意 对于其他编程语言如C++, 可以采用类似的逻辑结构: ```cpp #include <vector> #include <algorithm> std::vector<int> NonMaxSuppression(const std::vector<std::array<float, 4>>& boxes, const std::vector<float>& scores, float threshold) { // ... 类似Python版的具体实现 ... } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值