AI大模型介绍yolo
1. 概述
1.1 YOLO的基本特点
- 速度快
- 准确率高
- 可解释性强
- 适用性广
1.2 YOLO发展历程
2015 : YOLOV1
2016: YOLO9000v2
2018: YOLOV3
2020: Scaled YOLOV4, PP-YOLO, YOLOV5,YOLOV6
2021: YOLOX,YOLOR,PP-YOLOV2
2022: DAMO YOLO, PP-YOLOE, YOLOV7, YOLOV6
2023: YOLOV8
2 模型介绍
2.1 模型原理
rcnn使用区域建议方法,首先在一张图像中产生可能的边界框。分类后,利用后处理对边界框进行细化,消除重复检测,并根据场景中的其他对象边界框进行重新扫描,这些复杂的流水线很慢。并且因为每个独立的部分都需要被分开训练,所以很难优化。
yolo模型原理:将目标检测重新定义为一个单一的检测问题,从图像像素直接到边界框坐标和类别概率。使用过一个卷积神经网络同时预测多个边界框和这些框类别概率。模型在完整的图像上训练,并直接优化检测性能。这个统一的模型相比较于传统检测模型有很多优点。YOLO设计可以实现端到端训练和实时的速度,同时保持较高的平均精度。
- 将输入图像分成S*S的网格,如果一个目标的中心落入一个网格单元中,该网络单元负责检测目标
- 每个网格单元预测这些盒子的B个边界框和置信度分数
- 置信度分数反映了该模型对盒子是否包含目标的置信度,以及它预测盒子的准确程度
Yolo的输出包含两部分:
(1)边界框(Bounding Boxes)参数:每个边界框包含5个预测:x,y,w,h和confidence(置信度)。(x,y)坐标表示边界框相对于网格单元边界框的中心。宽w和高h是整张图像相对长度预测。还有一个置信度,计算公式如下:
c o n f i d e n c e = P r ( O b j e c t ) ∗ I O U confidence = Pr(Object)*IOU confidence=Pr(Object)∗