YoloV3
Yolo V3 主要改进点(相对于YoloV2):
- 采用了新的残差结构,YoloV2中也引入了残差结构(reorg),与YoloV2不同,YoloV3主要采用的是类似于resnet中的残差机构,不同的是YoloV3去掉了最后一个1X1的卷积层,如下图:
2. YoloV3采用了多尺度训练的方法,共有三个输出,输出的feature map分别为13X13, 26X26, 52X52,分别用来检测大中小三种不同大小的物体,每个feature map都拥有三个不同尺度的anchors, (anchors生成的方式也和YOLOV2 相同都是都过K-means算法对数据集进行划分的)。
- 回归采用的逻辑回归。(实际做中还按照原来以前的做就可以)
- 引入了FPN(feature pyramid network)特征图像金字塔结构,使低层的语义信息和高层的物理信息相结合,类似于分割网络中的U-net结构,唯一不同的是,U-Net 进行上采样最后只有一个输出,FPN结构在每一层都有输出。