yolov2升级：bn层优化、高分辨率与锚点机制详解-优快云博客

本文链接：https://blog.youkuaiyun.com/ffllxx123/article/details/125816177

在这里插入图片描述
相对于v1做的改进。

BN层

在这里插入图片描述
sigmod输入过大或过小就会造成梯度消失，所以利用BN使数据正态分布。

上图一共有8个样本，batch size = 8，然后每个神经元单独做标准化，比如对1 1.5 1.2 0.9，，这8个算出均值，标准差，然后标准化。

标准化后的结果。都在0附近了。

高分辨率的分类器

在这里插入图片描述
v1是在224x224的图像上训练的，v2换成在448x448的图像上训练了。

anchor机制

在这里插入图片描述
vi的bbox的形状是随机的，而v2确定两个bbox一个是瘦高的，一个是矮胖的，后续只是位置的微调。

v2是划分为13x13个grid cell，每个grid cell有5个anchor，事先设置好的5种大小不同的框，假如预测花，则花的中心点在哪个grid cell里面，就由这个grid cell的5个anchor里面iou最大的负责预测。
在这里插入图片描述
这个白框是人为的，由4号区域的与白框iou最大的anchor负责拟合，得到这个anchor对应的预测框，最后输出相对这个预测框相对初始anchor的偏移量就行了。

v2里面类别归anchor管了，v2里面一个grid cell有5个anchor,每个anchor有25个参数。最后是13x13x125。
在这里插入图片描述最后是13x13x125，最终结果的参数就在这个张量里面。