YOLOV3

为什么叫 53 :因为有53个卷积,最后一个全连接层也算!
这里是convolutional其实是conv+BN+leakyRElu
这里的黑色框是个残差结构类似于这样:

yolov3 由聚类算法生成了9 个 bounding box ,最后分别生成三个特征图,每个特征图份三个

(下面这个图还是不错的 )

这里的虚线就是bounding box

关于正负样本的理解;首先对于每个Ground truth box都被分配一个bounding box 。和GT box重合度最大的bounding box 是正样本。设置一个阈值 假如大于0.5 ,但又不是最大,那么我们把它舍弃,小于0.5的都是负样本。对于 丢弃的 bounding box只有 confidence 这个损失。

原文提到了逻辑回归,用到了二值交叉熵损失。
蓝色框代表bounding box(锚框,聚类生成)
绿色 是grond truth box
黄色 是预测框
每种特征图,中每一个 grid 都有3个 bounding box


博客主要介绍了YOLOV3算法,因其有53个卷积(最后全连接层也算)得名,其convolutional是conv+BN+leakyRElu,有残差结构。由聚类算法生成9个bounding box并产生三个特征图,还阐述了正负样本的判定及损失情况,原文用到逻辑回归和二值交叉熵损失。
3604

被折叠的 条评论
为什么被折叠?



