V1
v1训练使用的是224224的 测试时使用了448448
流程:
1.输入图像 4484483(大小不能变,因为有全连接层)
2. conv 得到特征图 771024 (GoogleNet)
3.全连接 40961
4.全连接 14701
5. reshape一下 7730
获得7*7个格子,每个格子中有30个值
因为 有两个经验框 (其他模型没必要那么细) 每个框 x1/x2 y1/y2 w1/w2 h1/h2 置
信度(x,y 都是一个相应的位置,不是他的具体位置 ,归一化过后的)
两个框5+5 +20个类别
20类别 =狗的概率 | 猫的概率 | …
损失函数:
1.先计算位置的误差 x y的
w h加根号的原因就是 解决小物体中 偏移量小时原来可能不明显,(但是加了之后稍微改进一点。) 数值较小时 数据敏感 数据较大的时候不太敏感。
2.置信度的损失计算
首