非极大值抑制详细原理(NMS含代码及详细注释)

作者主页:爱笑的男孩。的博客_优快云博客-深度学习,YOLO,活动领域博主爱笑的男孩。擅长深度学习,YOLO,活动,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.youkuaiyun.com/Code_and516?type=collect

个人介绍:打工人。

分享内容:机器学习、深度学习、python相关内容、日常BUG解决方法及Windows&Linux实践小技巧。

如发现文章有误,麻烦请指出,我会及时去纠正。有其他需要可以私信我或者发我邮箱:zhilong666@foxmail.com

目录

非极大值抑制原理 

NMS源码含注释

需要的依赖包

nms算法

绘图

全部代码

效果图


非极大值抑制原理 

        非极大值抑制(Non-Maximum Suppression,NMS)是一种图像处理中的技术。它通常用于目标检测中,其主要作用是去除检测出来的冗余框,只保留最有可能包含目标物体的框,保留最优的检测结果。

        在目标检测中,我们通常使用一个检测器来检测出可能存在的物体,并给出其位置和大小的预测框。然而,同一个物体可能会被多次检测出来,从而产生多个预测框。这时,我们就需要使用NMS来去除掉这些重叠的框,只保留最优的一个。

        其基本原理是先在图像中找到所有可能包含目标物体的矩形区域,并按照它们的置信度进行排列。然后从置信度最高的矩形开始,遍历所有的矩形,如果发现当前的矩形与前面任意一个矩形的重叠面积大于一个阈值,则将当前矩形舍去。使得最终保留的预测框数量最少,但同时又能够保证检测的准确性和召回率。具体的实现方法包括以下几个步骤:

  1. 对于每个类别,按照预测框的置信度进行排序,将置信度最高的预测框作为基准。

  2. 从剩余的预测框中选择一个与基准框的重叠面积最大的框,如果其重叠面积大于一定的阈值,则将其删除。

  3. 对于剩余的预测框,重复步骤2,直到所有的重叠面积都小于阈值,或者没有被删除的框剩余为止。

        通过这样的方式,NMS可以过滤掉所有与基准框重叠面积大于阈值的冗余框,从而实现检测结果的优化。值得注意的是,NMS的阈值通常需要根据具体的数据集和应用场景进行调整,以兼顾准确性和召回率。

        总结来说,非极大值抑制原理是通过较高置信度的目标框作为基准,筛选出与其重叠度较低的目标框,从而去除掉冗余的目标框,提高目标检测的精度和效率。

NMS源码含注释

需要的依赖包

import numpy as np 
import matplotlib.pyplot as plt
#安装
#pip install numpy==1.19.5 -i https://pypi.tuna.tsinghua.edu.cn/simple/
#pip install matplotlib==3.2.2 -i https://pypi.tuna.tsinghua.edu.cn/simple/ 

nms算法

#nms 算法
def py_cpu_nms(dets, thresh):
    #边界框的坐标
    x1 = dets[:, 0]#所有行第一列
    y1 = dets[:, 1]#所有行第二列
    x2 = dets[:, 2]#所有行第三列
    y2 = dets[:, 3]#所有行第四列
    #计算边界框的面积
    areas = (y2 - y1 + 1) * (x2 - x1 + 1) #(第四列 - 第二列 + 1) * (第三列 - 第一列 + 1)
    #执行度,包围盒的信心分数
    scores = dets[:, 4]#所有行第五列

    keep = []#保留

    #按边界框的置信度得分排序   尾部加上[::-1] 倒序的意思 如果没有[::-1] argsort返回的是从小到大的
    index = scores.argsort()[::-1]#对所有行的第五列进行从大到小排序,返回索引值

    #迭代边界框
    while index.size > 0: # 6 > 0,      3 > 0,      2 > 0
        i = index[0]  # every time the first is the biggst, and add it directly每次第一个是最大的,直接加进去
        keep.append(i)#保存
        #计算并集上交点的纵坐标(IOU)
        x11 = np.maximum(x1[i], x1[index[1:]])  # calculate the points of overlap计算重叠点
        y11 = np.maximum(y1[i], y1[index[1:]])  # index[1:] 从下标为1的数开始,直到结束
        x22 = np.minimum(x2[i], x2[index[1:]])
        y22 = np.minimum(y2[i], y2[index[1:]])

        #计算并集上的相交面积
        w = np.maximum(0, x22 - x11 + 1)  # the weights of overlap重叠权值、宽度
        h = np.maximum(0, y22 - y11 + 1)  # the height of overlap重叠高度
        overlaps = w * h# 重叠部分、交集

        #IoU:intersection-over-union的本质是搜索局部极大值,抑制非极大值元素。即两个边界框的交集部分除以它们的并集。
        #          重叠部分 / (面积[i] + 面积[索引[1:]] - 重叠部分)
        ious = overlaps / (areas[i] + areas[index[1:]] - overlaps)#重叠部分就是交集,iou = 交集 / 并集
        print("ious", ious)
        #               ious <= 0.7
        idx = np.where(ious <= thresh)[0]#判断阈值
        print("idx", idx)
        index = index[idx + 1]  # because index start from 1 因为下标从1开始
    return keep #返回保存的值

绘图


#画图函数
def plot_bbox(dets, c='k'):#c = 颜色 默认黑色
    # 边界框的坐标
    x1 = dets[:, 0]  # 所有行第一列
    y1 = dets[:, 1]  # 所有行第二列
    x2 = dets[:, 2]  # 所有行第三列
    y2 = dets[:, 3]  # 所有行第四列

    plt.plot([x1, x2], [y1, y1], c)#绘图
    plt.plot([x1, x1], [y1, y2], c)#绘图
    plt.plot([x1, x2], [y2, y2], c)#绘图
    plt.plot([x2, x2], [y1, y2], c)#绘图
    plt.title("nms")#标题

全部代码

#导入数组包
import numpy as np
import matplotlib.pyplot as plt#画图包

#画图函数
def plot_bbox(dets, c='k'):#c = 颜色 默认黑色
    # 边界框的坐标
    x1 = dets[:, 0]  # 所有行第一列
    y1 = dets[:, 1]  # 所有行第二列
    x2 = dets[:, 2]  # 所有行第三列
    y2 = dets[:, 3]  # 所有行第四列

    plt.plot([x1, x2], [y1, y1], c)#绘图
    plt.plot([x1, x1], [y1, y2], c)#绘图
    plt.plot([x1, x2], [y2, y2], c)#绘图
    plt.plot([x2, x2], [y1, y2], c)#绘图
    plt.title("nms")#标题

#nms 算法
def py_cpu_nms(dets, thresh):
    #边界框的坐标
    x1 = dets[:, 0]#所有行第一列
    y1 = dets[:, 1]#所有行第二列
    x2 = dets[:, 2]#所有行第三列
    y2 = dets[:, 3]#所有行第四列
    #计算边界框的面积
    areas = (y2 - y1 + 1) * (x2 - x1 + 1) #(第四列 - 第二列 + 1) * (第三列 - 第一列 + 1)
    #执行度,包围盒的信心分数
    scores = dets[:, 4]#所有行第五列

    keep = []#保留

    #按边界框的置信度得分排序   尾部加上[::-1] 倒序的意思 如果没有[::-1] argsort返回的是从小到大的
    index = scores.argsort()[::-1]#对所有行的第五列进行从大到小排序,返回索引值

    #迭代边界框
    while index.size > 0: # 6 > 0,      3 > 0,      2 > 0
        i = index[0]  # every time the first is the biggst, and add it directly每次第一个是最大的,直接加进去
        keep.append(i)#保存
        #计算并集上交点的纵坐标(IOU)
        x11 = np.maximum(x1[i], x1[index[1:]])  # calculate the points of overlap计算重叠点
        y11 = np.maximum(y1[i], y1[index[1:]])  # index[1:] 从下标为1的数开始,直到结束
        x22 = np.minimum(x2[i], x2[index[1:]])
        y22 = np.minimum(y2[i], y2[index[1:]])

        #计算并集上的相交面积
        w = np.maximum(0, x22 - x11 + 1)  # the weights of overlap重叠权值、宽度
        h = np.maximum(0, y22 - y11 + 1)  # the height of overlap重叠高度
        overlaps = w * h# 重叠部分、交集

        #IoU:intersection-over-union的本质是搜索局部极大值,抑制非极大值元素。即两个边界框的交集部分除以它们的并集。
        #          重叠部分 / (面积[i] + 面积[索引[1:]] - 重叠部分)
        ious = overlaps / (areas[i] + areas[index[1:]] - overlaps)#重叠部分就是交集,iou = 交集 / 并集
        print("ious", ious)
        #               ious <= 0.7
        idx = np.where(ious <= thresh)[0]#判断阈值
        print("idx", idx)
        index = index[idx + 1]  # because index start from 1 因为下标从1开始
    return keep #返回保存的值

def main():
    # 创建数组
    boxes = np.array([[100, 100, 210, 210, 0.72],
                      [250, 250, 420, 420, 0.8],
                      [220, 220, 320, 330, 0.92],
                      [100, 100, 210, 210, 0.72],
                      [230, 240, 325, 330, 0.81],
                      [220, 230, 315, 340, 0.9]])
    show(boxes)

def show(boxes):
    plt.figure(1)  # 画图窗口、图形
    plt.subplot(1, 2, 1)  # 子图
    plot_bbox(boxes, 'k')  # before nms 使用nms(非极大抑制)算法前
    plt.subplot(1, 2, 2)  # 子图
    keep = py_cpu_nms(boxes, thresh=0.7)  # nms(非极大抑制)算法
    print(keep)
    plot_bbox(boxes[keep], 'r')  # after nms 使用nms(非极大抑制)算法后
    plt.show()  # 显示图像

if __name__ == '__main__':
    main()


效果图

 

<think>好的,用户想了解非极大值抑制NMS)算法的原理和实现。我之前已经回答过关于先验框生成算法的问题,现在需要根据用户提供的引用内容来组织回答。首先,我得回顾用户提供的引用资料,确保准确引用相关内容。 用户提供的引用中,引用[1]定义了NMS的基本概念,提到它在目标检测中的应用。引用[2]和[3]分别给出了C++和Python的实现注意事项,以及IoU的计算方法。引用[4]详细解释了NMS原理,特别是滑动窗口带来的冗余检测框问题。引用[5]则提供了Python实现的参考资料。 接下来,我需要结合这些引用内容,分步骤解释NMS原理和实现。首先,应该明确NMS的作用是去除重复的检测框,保留最可信的结果。原理部分需要说明为什么需要NMS,比如在目标检测中,多个重叠的框可能对应同一个物体,需要抑制低置信度的框。 然后,按照步骤详细描述算法流程。第一步是按置信度排序,这是引用[2]中提到的输入需要按分数从高到低排列的关键点。第二步是遍历并计算IoU,这里需要引用[3]中的IoU公式,并解释如何应用。第三步是抑制非极大值,即删除高IoU的框,这部分可以结合引用[4]中的局部极大值搜索概念。 在实现部分,用户可能希望看到Python代码示例,所以需要根据引用[3]和[5]的提示,编写一个简单的NMS函数,并注释关键步骤。同时要注意代码中的注意事项,如引用[2]提到的阈值调整和数据结构优化。 用户可能的问题包括NMS的变体、IoU的其他应用以及多类别处理,这些都需要在相关问题部分列出。同时,确保引用正确,比如在解释IoU时引用[3],在算法步骤中引用[4]。 需要检查是否有遗漏的引用内容,比如引用[1]中的NMS应用场景,可以在原理部分提到。另外,引用[2]提到的注意事项,如输入顺序和阈值调整,应该在实现注意事项中强调。 最后,确保回答结构清晰,分原理和实现两部分,代码可读性强,相关问题具有针对性。同时,使用正确的中文表达,避免技术术语错误,保持口语化但专业的语气。</think>### 非极大值抑制NMS)算法原理与实现 #### 核心原理 非极大值抑制NMS)是目标检测中用于去除冗余检测框的关键后处理算法。其核心思想是:**在重叠区域中仅保留置信度最高的检测框,抑制其他低置信度的冗余框**。以下是分步原理说明: 1. **冗余框产生原因** 目标检测模型(如YOLO、Faster R-CNN)可能对同一物体生成多个重叠的候选框(例如通过滑动窗口或锚框机制),这些框的置信度(score)差异较小但覆盖区域高度重叠[^4]。 2. **算法目标** 从一组重叠的候选框中,选择置信度最高的框作为代表,并抑制其他与它交并比(IoU)超过阈值的低置信度框[^1]。 3. **关键数学定义** - **交并比(IoU)**:衡量两个框的重叠程度,计算为交集面积与并集面积的比值[^3]: $$ \text{IoU} = \frac{A \cap B}{A \cup B} $$ - **抑制阈值**:通常设置为$0.5$或$0.7$,用于判定是否属于同一物体。 #### 算法流程 1. **按置信度排序** 将所有候选框按置信度从高到低排序,形成列表$B = \{b_1, b_2, ..., b_n\}$($b_1$为最高分)[^2]。 2. **迭代筛选** - 选择当前最高分框$b_i$,加入最终结果集 - 计算$b_i$与剩余所有框的IoU - 删除所有IoU超过阈值的框 - 重复上述过程直到列表为空 #### Python代码实现 ```python import numpy as np def nms(boxes, scores, iou_threshold=0.5): """ Args: boxes: 候选框坐标数组,格式为[[x1,y1,x2,y2], ...],shape=(N,4) scores: 每个框的置信度,shape=(N,) iou_threshold: 抑制阈值(默认0.5) Returns: keep_indices: 保留框的索引 """ # 按置信度降序排序 order = np.argsort(scores)[::-1] keep = [] while order.size > 0: # 取当前最高分框 i = order[0] keep.append(i) # 计算当前框与剩余框的IoU x1 = np.maximum(boxes[i, 0], boxes[order[1:], 0]) y1 = np.maximum(boxes[i, 1], boxes[order[1:], 1]) x2 = np.minimum(boxes[i, 2], boxes[order[1:], 2]) y2 = np.minimum(boxes[i, 3], boxes[order[1:], 3]) w = np.maximum(0.0, x2 - x1) h = np.maximum(0.0, y2 - y1) intersection = w * h area_i = (boxes[i, 2] - boxes[i, 0]) * (boxes[i, 3] - boxes[i, 1]) area_j = (boxes[order[1:], 2] - boxes[order[1:], 0]) * \ (boxes[order[1:], 3] - boxes[order[1:], 1]) union = area_i + area_j - intersection iou = intersection / union # 保留IoU低于阈值的框索引 inds = np.where(iou <= iou_threshold)[0] order = order[inds + 1] # +1补偿order[1:]的偏移 return keep ``` #### 关键实现细节 1. **排序重要性** 必须先将候选框按置信度降序排列,确保优先处理最可能的真实目标。 2. **IoU计算优化** 使用向量化计算替代循环,提升处理效率(如示例代码中的矩阵操作)[^3]。 3. **阈值选择** - 阈值过低(如$0.3$)可能导致漏检 - 阈值过高(如$0.8$)可能导致重复框残留 - 通常目标检测任务中取$0.5$-0.7[^4] #### 变体与改进 1. **Soft-NMS** 用连续函数衰减相邻框的分数,而非直接删除,缓解密集物体漏检问题[^5]。 2. **类别相关NMS** 对多类别检测任务,需按类别分别进行NMS处理。 --- ### 相关问题 1. 如何解决NMS在密集目标检测中的性能下降问题? 2. Soft-NMS相比传统NMS有哪些改进?数学原理是什么? 3. 在多类别目标检测中如何优化NMS的计算效率?
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱笑的男孩。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值