想象一下,你在一场盛大的化妆舞会中,每个人都想成为舞池中的焦点。但问题来了,如果每个人都是焦点,那谁来欣赏谁呢?这就是NMS大显身手的时刻,它的任务就是在这个“人山人海”的舞会中找到真正的明星。
NMS的魔法
NMS工作起来就像是舞会上的明星挑选师,它会告诉你:“在这一区域,只能有一个明星,其他人请暂时退场。”具体到目标检测,就是在一堆重叠的边界框中,只保留最有可能包含目标的那一个,其他的则被优雅地“请出舞池”。
-
得分排序:将所有候选边界框(每个框都有一个与之相关的得分,表示检测到的对象在该框中的置信度)按照得分从高到低进行排序。
-
选择最高得分的边界框:从排序后的列表中选择得分最高的边界框作为参考框。
-
计算重叠度:对于剩余的每个边界框,计算它与参考框的交并比(IoU,Intersection over Union)。IoU是一个衡量两个边界框重叠程度的指标,计算公式为两个边界框交集的面积除以它们并集的面积。
-
移除重叠较多的边界框:如果某个边界框与参考框的IoU超过了预定的阈值(这个阈值是一个超参数,需要根据具体任务进行调整),则认为这两个框重叠过多,将该边界框从候选列表中移除。
-
重复选择和移除过程:从剩余的边界框中再次选择得分最高的框作为新的参考框,重复步骤3和步骤4,直到所有的边界框都被考虑过。
-
输出结果:最终保留下来的边界框即为通过NMS处理后的结果,这些框被认为是对实际目标的最佳预测。