本文主要介绍了YOLO V2 关于V1的变动。
YOLO V2
1.主要变化
回顾一下,在V1中,每个图片被分成7x7的cell,每个cell产生2个预测框,每个框有(x,y,w,h,confidence score)5个维度,以及20个类,因此V1的输出为7x7x(5x2+20) 的Tensor;
而在V2中,每个图片被分为13x13的cell,每个cell产生5个预测框,每个预测框包含(x,y,w,h,confidence score)5个维度以及20个类,因而V2的输出为13x13x5x(5+20)
(1)Batch normalization

在V2中对每一conv层都添加了BN,BN的具体步骤:
标准化具体步骤: 将输出减去均值,除以标准差,以将其集中到0附近,将标准化后的结果乘以权重加上偏置,就能得到BN后的结果
这里的偏置和权重需要训练得到
在测试阶段只需对训练阶段得到的所有参数进行线性变换即可得到测试阶段所需的偏置和权重
作用:
-
由于很多激活函数(例如sigmoid)在0附近为非饱和区,可以避免梯度消失,利于训练,因此使用BN将输出集中到0附近。
-
缩短训练时间:在神经网络的训练过程中,BN层可以使得网络加速收敛,从而缩短训练时间。
-
提高模型泛化能力:BN层可以有效地减少过拟合,提高模型的泛化能力。
YOLO V2对比V1的变动及缺点

最低0.47元/天 解锁文章
1149





