backbone is pre-trained on ImageNet ,which includes
VGG [68], ResNet [26], ResNeXt [86],or DenseNet [30]
neck are usu-ally used to collect feature maps from different stages.
head which is used to predict classes and bounding boxes of ob-jects, such as
e R-CNN [19] series, YOLO [61, 62, 63], SSD
双阶段目标检测:一个阶段提出备选框,一个阶段对备选框进行判断。是一个两阶段级联的网络。主要为RCNN系列的网络。
单阶段的网络,整个生成备选框的过程一体化的实现。代表有YOLO系列和SSD。
双阶段的检测网络,相当于在一阶段的密集检测上增加了一个稀疏的预测器,或者说一阶段网络是二阶段网络的RPN部分
图像语义分割:举例来说,如果一张照片中有多个人于语义分割来说,只要将所由人的像素都归为一类,但是实例分割还要将不同人的像素归为不同的类。也就是说实例分割比语义分割更进一步。
深度学习中的注意力机制(Attention Mechanism)和人类视觉的注意力机制类似,就是在众多信息中把注意力集中放在重要的点上,选出关键信息,而忽略其他不重要的信息。
Anchor-free and Anchor-based
目标检测算法一般可分为anchor-based、anchor-free,或是两者的融合, 区别就在于有没有利用anchor提取候选目标框
1.anchor-based类算法代表是fasterRCNN、SSD、YoloV2/V3等
2.anchor-free类算法代表是CornerNet、ExtremeNet、CenterNet、FCOS等
博客介绍了目标检测相关内容,包括backbone常用的预训练模型,neck用于收集特征图,head用于预测目标类别和边界框。还阐述了双阶段和单阶段目标检测网络的特点及代表网络,图像语义分割和实例分割的区别,深度学习注意力机制,以及anchor-based和anchor-free两类目标检测算法代表。
4193

被折叠的 条评论
为什么被折叠?



