YOLO

YOLO(You Only Look Once)是一种目标检测算法,通过将图片分割成网格,每个单元格预测边界框及其置信度和类别概率。网络结构基于GoogleNet,包含卷积和全连接层,使用Leaky ReLU激活函数。预训练在ImageNet上,损失函数考虑了边界框坐标、置信度和分类误差。预测时,通过置信度阈值和NMS处理得到检测结果。YOLO的优点是快速、端到端,但对小物体和宽高比较大的物体检测效果不佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

理念:

将输入的图片分割成SS网格,然后每个单元格负责检测中心点落在该单元格的目标。,每个单元格预测B个边界框以及边界框的置信度。置信度=Pr(object)是否有目标IOU。如果有目标Pr(Object)=1,否则为0,边界框的位置用(x,y,w,h)来表示,中心坐标的预测值(x,y)是相对于每个单元格左上角坐标的偏移,w,h是相对于整个图片的宽与高的比例,因此四个值应该都在(0,1)之间
分类问题:
每个单元格要预测C个类别概率值,表示的是该单元格负责预测的边界框属于各个类别的概率
每个单元格只预测一组类别概率值,即最终预测值为SS(B*5+C)
网路i结构:
参考的是GoogleNet 包含24个卷积层和2个全连接层。都采用Leaky ReLu激活函数 max(x,0.1x),最后一层采用的是线性激活函数

在这里插入图片描述
对于每个单元格,前20个元素是类别概率值,然后两个元素是边界框置信度,最后8个元素是边界框的(x,y,w,h)
因为每个单元格预测两个边界框。
在这里插入图片描述
网络预训练:在ImageNet上进行预训练,采用前20个卷积层,然后添加一个平均池化层和全连接层。与训练之后,将预训练得到的20层卷积层加上随机初始化的4个卷积层和2个全连接层。为了更高清的图片,将网络输入增加到448*448

损失函数:
在这里插入图片描述
在这里插入图片描述
包含目标的边界框的置信度权重值为1,不包含目标的置信度权重值为0.5即在这里插入图片描述
损失函数第一项为边界框中心坐标的误差项,第二项为边界框的高与

宽的误差项,第三项为包含目标的置信度误差项,第四项是不包含目标的置信度误差项,第五项是包含目标的单元格的分类误差项。在这里插入图片描述指的是第i个单元格中的第j个边界框负责预测该目标
网络预测:
有前面可知,网络最后的输出为7730,将其分为3个部分,类别概率部分为[7,7,20],置信度部分为[7,7,2],边界框部分为[7,7,2,4],将前两部分相乘得到类别置信度([7,7,1,20][7,7,2,1]=[7,7,2,20]),总共预测了77*2=98个边界框。
有两种策略得到检测框的结果。第一种首先每个边界框根据类别置信度最大的那个类别作为其预测标签其预测标签,经过此处理得到各个边界框的越策类别及对应的置信度值,大小为[7,7,2].一般情况下设置置信度阈值,将置信度小于该阈值的box过滤掉,然后再对剩余的边框进行NMS处理,最后留下来的就是检测结果。
需要注意的一点是NMS是分类别的使用NMS还是对所有预测框一视同仁。YOLO使用的是先使用NMS,再确定每个box的类别。基本过程是对于98个boxes,首先将小于置信度阈值的值归为0,然后分类对置信度值采用NMS,这里NMS处理结果不是剔除,而是将其置信度值归为0.
在这里插入图片描述
优缺点:
优点
采用了一个CNN实现检测,是单管道策略,其训练和预测都是end-to-end。算法简洁速度快,由于是对整个图片进行卷积,所以在其检测目标有更大的视野,不容易对背景误判。泛化能力强,在做迁移时,模型鲁棒性高。
缺点:各个单元格仅预测两个边界框,而且属于一个类别,对于小物体,yolo的检测效果不好。yolo在物体的宽高比方面泛化率低,无法定位不寻常比例的物体。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1. 用户与权限管理模块 角色管理: 学生:查看实验室信息、预约设备、提交耗材申请、参与安全考核 教师:管理课题组预约、审批学生耗材申请、查看本课题组使用记录 管理员:设备全生命周期管理、审核预约、耗材采购与分发、安全检查 用户操作: 登录认证:统一身份认证(对接学号 / 工号系统,模拟实现),支持密码重置 信息管理:学生 / 教师维护个人信息(联系方式、所属院系),管理员管理所有用户 权限控制:不同角色仅可见对应功能(如学生不可删除设备信息) 2. 实验室与设备管理模块 实验室信息管理: 基础信息:实验室编号、名称、位置、容纳人数、开放时间、负责人 功能分类:按学科(计算机实验室 / 电子实验室 / 化学实验室)标记,关联可开展实验类型 状态展示:实时显示当前使用人数、设备运行状态(正常 / 故障) 设备管理: 设备档案:名称、型号、规格、购置日期、单价、生产厂家、存放位置、责任人 全生命周期管理: 入库登记:管理员录入新设备信息,生成唯一资产编号 维护记录:记录维修、校准、保养信息(时间、内容、执行人) 报废处理:登记报废原因、时间,更新设备状态为 "已报废" 设备查询:支持按名称、型号、状态多条件检索,显示设备当前可用情况 3. 预约与使用模块 预约管理: 预约规则:学生可预约未来 7 天内的设备 / 实验室,单次最长 4 小时(可设置) 预约流程:选择实验室→选择设备→选择时间段→提交申请(需填写实验目的) 审核机制:普通实验自动通过,高危实验(如化学实验)需教师审核 使用记录: 签到 / 签退:到达实验室后扫码签到,离开时签退,系统自动记录实际使用时长 使用登记:填写实验内容、设备运行情况(正常 / 异常),异常情况需详细描述 违规管理:迟到 15 分钟自动取消预约,多次违规限制预约权限 4. 耗材与安全管理模块 耗材管理: 耗材档案:名称、规格、数量、存放位置、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值