
目标检测模块
文章平均质量分 69
THE@JOKER
一个无耻混蛋
展开
-
各种FPN:PANet、ASFF、NAS-FPN、BiFPN、Recursive-FPN...
早期的物体检测算法,无论是一步式的,还是两步式的,通常都是在Backbone的最后一个stage(特征图分辨率相同的所有卷积层归类为一个stage)最后一层的特征图,直接外接检测头做物体检测。此种物体检测算法,可以称之为单stage物体检测算法。由于单stage物体检测算法中,Backbone的最后一个stage的stride通常是32,导致输出的特征图分辨率是输入图片分辨率的1/32,太小,不利于物体检测,因此单stage的物体检测算法,一般会将最后一个stage的MaxPooling去掉或者将stri转载 2021-06-18 17:00:56 · 41290 阅读 · 6 评论 -
目标检测 | 数据增强、backbone、head、neck、损失函数
一、数据增强方式random eraseCutOutMixUpCutMix色彩、对比度增强旋转、裁剪解决数据不均衡:Focal losshard negative example miningOHEMS-OHEMGHM(较大关注easy和正常hard样本,较少关注outliners)PISA二、常用backbone三、常用HeadDense Prediction (one-stage):Sparse Prediction (two-stage):Path-a转载 2021-04-15 14:32:53 · 386 阅读 · 0 评论 -
Rotated IoU 计算
文章目录简介旋转包围盒的编码方式矢量的旋转公式包围盒转化为角点相交区域的特点点在四边形(矩形)内点积的物理意义线段交点相交后转化为直线交点计算相交区域面积顶点排序顶点排序代码简易版三角剖分所有代码简介在目标检测的领域,基于Anchor的方法需要对Anchor分配正负样本的标签。通常,对于axis-aligned的anchor和ground truth,可以直接通过 [top left right down]四个值计算他们之间的重叠面积。但是针对于旋转的矩形框,这个问题就变得尤为复杂。我参考了3D目标转载 2021-04-10 21:04:40 · 7962 阅读 · 3 评论 -
Rotated_IoU 计算
两个旋转矩形的IOU计算方法# 中心点 矩形的w h, 旋转的theta(角度,不是弧度)def iou_rotate_calculate(boxes1, boxes2): area1 = boxes1[:, 2] * boxes1[:, 3] area2 = boxes2[:, 2] * boxes2[:, 3] ious = [] for i, box1 in enumerate(boxes1): temp_ious = [] r1 =原创 2021-04-09 21:14:38 · 1497 阅读 · 2 评论 -
DCNets V1
《Deformable Convolutional Networks》是2017年发布在ICCV上的论文。一种全新的卷积结构。这种方法将固定形状的卷积过程改造成了能适应物体形状的可变的卷积过程,从而使结构适应物体形变的能力更强。一、要解决的问题存在的问题:CNN在提取空间信息上存在的不足这个不足源于CNN模型固定的空间结构:1)固定的卷积层对不同的特征图都采用相同的卷积操作,采样的像素点的位置是固定的,使得采样出来的信息包括很多背景的特征。2)max pooling层会降低图像分辨率。3)Ro转载 2021-04-06 16:48:22 · 202 阅读 · 0 评论 -
L1 、 L2 、 smooth L1 loss
均方误差MSE (L2 Loss)均方误差(Mean Square Error,MSE)是模型预测值f(x) 与真实样本值y 之间差值平方的平均值,其公式如下原创 2021-04-05 22:22:00 · 574 阅读 · 0 评论 -
2D / 3D IOU
IoU(Intersection over union):交并比IoU衡量的是两个区域的重叠程度,是两个区域重叠部分面积占二者总面积的比例。在目标检测中,如果模型输出的结果与真值gt的交并比 > 某个阈值(0.5或0.7)时,即认为我们的模型输出了正确的结果。IoU 计算的必要项:groundtruth bounding boxes,例如,测试集中手工标注的物体边界框.Apredicted bounding boxes, 检测算法模型所预测的输出.B目标检测中,算法的性能好坏,预测的边界原创 2021-04-03 16:33:08 · 4531 阅读 · 5 评论 -
目标检测中的4种IoU Loss
IoU目标检测任务的损失函数一般由Classificition Loss(分类损失函数)和Bounding Box Regeression Loss(回归损失函数)两部分构成。Bounding Box Regeression的Loss近些年的发展过程是:Smooth L1 Loss-> IoU Loss(2016)-> GIoU Loss(2019)-> DIoU Loss(2020)->CIoU Loss(2020)IoU(Intersection of Union)是指预原创 2021-03-22 14:05:15 · 6551 阅读 · 1 评论 -
AOS(Average Orientation Similarity)
定义:平均方向相似性,计算如下所示:其中,r代表物体检测的召回率。在因变量r下,方向相似性s∈[0,1]被定义为所有预测样本与ground truth余弦距离的归一化:其中D®表示在召回率r下所有预测为正样本的集合,∆θ(i) 表示检出物体i的预测角度与ground truth的差。为了惩罚多个检出匹配到同一个ground truth,如果检出i已经匹配到ground truth设置δi = 1,否则δi = 0。用途: 用于衡量检测结果与ground truth的方向相似程度转:https:转载 2021-03-21 21:11:26 · 2497 阅读 · 1 评论 -
AP,mAP
AP(Average Precision)AP (Average precision)是主流的目标检测模型的评价指标。定义:平均精度,就是对PR曲线上的Precision值求均值,即PR曲线下的面积。由于IoU有三种计算方式,对应地,AP也有三种计算方式:AP(2D)、AP(3D)、AP(BEV)用途:用来衡量算法在单个类别上的平均精度。AP值越高,表示对这个类别的检测精度越高。计算:积分,或可采用11点插值法和所有点插值法来估算AP值。但是在实际应用中,我们不是去对其进行计算,而是对其平滑操原创 2021-03-21 21:00:23 · 1703 阅读 · 0 评论 -
PR曲线与ROC曲线
PR曲线概念PR曲线中的P代表的是precision(精准率),R代表的是recall(召回率),其代表的是精准率与召回率的关系,一般情况下,将recall设置为横坐标,precision设置为纵坐标。PR曲线功能说明一条PR曲线要对应一个阈值(统计学的概率)。通过选择合适的阈值(比如K%)对样本进行合理的划分,概率大于K%的样本为正例,小于K%的样本为负例,样本分类完成后计算相应的精准率和召回率,最后我们会得到对应关系,如下图所示。...原创 2021-03-21 20:17:33 · 5629 阅读 · 1 评论 -
召回率(recall)和精度(precision)
识别精度主要是由召回率(recall)和精度(precision)表示的。通过绘制precision-recall 曲线,该曲线下方的面积越大,识别精度也就越高,反之越低。在说明 recall 和 precision 计算公式之前需要先介绍几个数据定义。在一个数据集检测中,会产生四类检测结果:TP、TN 、FP 、FN:T ——true 表示正确F——false 表示错误P—— positive 表示积极的,看成正例N——negative 表示消极的,看成负例我的理解:后面为预测结果,前面原创 2021-03-21 19:31:48 · 102751 阅读 · 6 评论 -
Focal loss
大家都知道,one-stage的检测精度比不上two-stage,一个主要原因是训练过程样本不均衡造成的。那什么是样本不均衡?这里先记录下几个检测任务中的基本概念;1、正样本:标签区域内部的图像区域,也就是目标图像块。2、负样本:标签区域以外的图像区域,也就是背景区域。3、易分正样本:容易正确分类的正样本,单个loss小,单数数量多,累计Loss大。4、易分负样本:容易正确分类的负样本,单个loss小,单数数量多,累计Loss大。5、难分正样本:错分成负样本的正样本,单个loss大,单数数量少,原创 2021-03-29 22:09:23 · 361 阅读 · 0 评论 -
Bounding Box Regression
原创 2021-03-30 17:21:02 · 108 阅读 · 0 评论 -
各种 NMS
NMS(Non Maximum Suppression),又名非极大值抑制,是目标检测框架中的后处理模块,主要用于删除高度冗余的bbox。经典NMS实现步骤如下:选取这类output bbox中scores(置信度)最大的哪一个,记为bbox_best,并保留它计算bbox_best与其余的bbox的IOU如果其IOU>0.5了,那么就舍弃这个bbox(由于可能这两个box表示同一目标,所以保留分数高的哪一个)从最后剩余的bboxes中,再找出最大scores的哪一个,如此循环往复i原创 2021-03-31 17:48:18 · 639 阅读 · 0 评论