
目标检测
文章平均质量分 56
未来可期,期许未来
这个作者很懒,什么都没留下…
展开
-
DilatedEncoder
DilatedEncoder原创 2023-02-08 00:56:51 · 296 阅读 · 0 评论 -
将数据集的VOC格式转为yolo格式
将数据集的VOC格式转为yolo格式原创 2022-08-24 22:25:00 · 880 阅读 · 0 评论 -
笔记:Faster R-CNN系列以及FPN
R-CNN:注意首先去掉AlexNet的全连接层,则剩下的AlexNet的最后一层经过展平处理为4096维,则2000个候选区域经过AlexNet后为20004096维矩阵(每一行为一个候选区域的特征向量)20004096的每一行为一个候选区域的特征向量,而409620的每一列表示一种分类器(比如,第一列为猫的分类器,第二列为狗的分类器),得到的200020矩阵(例如,第一行的第一个元素表示第一个候选区域为猫的概率,第一行第二个元素表示第一个候选区域为狗的概率)的每一列表示每个候选区域属于某分类原创 2021-05-12 15:41:55 · 2748 阅读 · 0 评论 -
笔记:YOLOv1-v2-v3
YOLOv1将一幅图像分成77个网格,在训练之前会进行人工标注-GT box ,它的中心落在哪个网格上,就负责预测这个目标在这里,每个网格需要预测B个bounding box和C个类别分数。B一般取2,每个bounding box除了要预测位置信息(4个值),还要预测一个confidence(YOLO独有)每个网格需要预测2个bounding box和20个类别分数,故25+20=3077表示图像中每个ceil(网格)所对应的信息,比如下图中11*30可以理解为第一个ceil的预测参数不原创 2021-05-14 19:54:13 · 419 阅读 · 1 评论 -
笔记:SSD
SSDFaster R-CNN:1.对小目标检测效果差:只是在一个特征层上进行预测,而此特征层是经过许多卷积层后所得到的feature map,已经被抽象到比较高的层次,所以细节信息的保留较少。而小目标的检测需要细节信息 ,以至于在高层的特征层上来预测我们的小目标,检测效果没有那么好2.模型大,检测速度慢:在RPN进行了一次预测,在Fast R-CNN又进行了一次预测(two-stage 的通病)在SSD上由6个预测特征层,在步距为2的时候,padding为1;在步距为1的时候,padding为原创 2021-05-13 08:01:55 · 115 阅读 · 0 评论 -
mAP与coco的评价指标
目标检测常用的两个数据集:PASCAL VOC 与 MS COCO数据集mAP:mean Average Precision, 即各类别AP的平均值‘预测得到的是:bounding box; 人工标注的是:ground Truth box(GT box)’IoU指的是预测的bounding box与人工标注的GT box的交并比TP(True Positive):IoU>0.5的检测框数量FP(False Positive):IoU<=0.5的检测框数量(或者检测到同一个GT的原创 2021-05-09 14:48:22 · 3396 阅读 · 1 评论