图像目标检测算法-YOLOV5的学习

一、yolov5的网络结构,官方给出的不同版本的yolov5模型区别在哪,这些区别会带来那些改变。

yolov5 5.0 的结构,输入会经过Focus结构,上图:

backbone 主要包含:Focus,C3,conv等结构,现在分别讲解:

Focus 网络:Focus 网络是对输入图片进行切片操作,假设输入图片的大小为640×640×3,间隔一个元素提取,每个通道整合输出320×320×4的数据,四个通道以此进行此操作。将每个通道相同位置的元素提取整合concat在一起。这样做的目的就是输入数据大小减小一半,但没有特征的损失,

Conv 结构包括:2d卷积、BN层、SILU层。

BN层:BN层的提出,主要是为了解决大部分的数据落入非线性饱和区,导致模型训练过程梯度消失,一方面增加模型训练时间,还有很大的可能模型到最后无法收敛。通过计算模型批次训练数据的均值和方差,对训练数据进行均值为0,方差为1的归一化处理。如果激活函数采用的是sigmoid 函数,可让大部分的训练数据落入线性区域内,加快模型的训练收敛速度,同时考虑到归一化处理后,对数据分布的变化比较大,引入缩放平移参数对数据进行仿射变换,尽可能保持数据的原始分布,又不至于让数据完全落入饱和区域内。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值