yolov4和v5

在这里插入图片描述
在这里插入图片描述
back bone
在这里插入图片描述
使用了spp结构,一定程度上解决了多尺度问题。
在这里插入图片描述
第一个圈是back bone,第二个圈是 fpn金字塔结构,第三个圈是倒金字塔结构。
在这里插入图片描述
v4的整体结构

优化策略

在这里插入图片描述
这是v3的,有一个问题,就说当grid cell的中心点落在交线上就不太好处理。
在这里插入图片描述
所以v4增加了一个scale因子,scale可以取2。
在这里插入图片描述
这个是v3的匹配,先拿左边3个anchor和gt做iou计算,然后看gt的中心点落在哪个grid cell里面,就用这个grid cell的3个anchor里iou大于0.3的作为正样本,用它来预测了。
在这里插入图片描述
这个是v4了,可以看到,gt框的中心点落在一个grid cell里面,再加上左边和上边的grid cell,因为经过右下角的变化,变成-0.5到1.5了,然后上面这个grid cell的左上角顶点的x坐标距离中心点小于0.5,y坐标也是小于1.5的,所以上面这个grid cell可以入选。
在这里插入图片描述
更多情况如上图所示。
在这里插入图片描述
尺度。

v5

https://blog.youkuaiyun.com/qq_37541097/article/details/123594351
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这个图就是注意力机制了。
在这里插入图片描述
换成了sppf,
在这里插入图片描述
数据增强。mosaic,将四张图片拼成一张图片,可以增加多样性。
在这里插入图片描述
把人扣下来,和长颈鹿放在一起。
在这里插入图片描述
仿射变换,平移旋转缩放等等,
在这里插入图片描述
把两张图片设置透明程度混合成一张图片。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值