第一章 前言

1.1、 核心思想
YOLO系列的核心思想就是把目标检测转变为一个回归问题,利用整张图片作为网络的输入,通过神经网络,得到边界框的位置及其所属的类别。这是和RCNN系列的本质区别。
1.2、 架构组成
YOLOV1至YOLOV10是目标检测领域的一系列算法,它们的主要组成部分包括Input(输入)、Backbone(骨干网络)、Neck(颈部网络)和Head(头部网络)。这些组件在目标检测模型中各自扮演着重要的角色。

以下是对这些组件作用的详细解释:
Input(输入)
-
作用:Input是目标检测模型的起始点,负责接收和处理原始图像数据。在训练阶段,Input通常包括resize(调整图像大小)、数据增强(如翻转、旋转、裁剪等)等操作,以提高模型的泛化能力。在测试阶段,则主要进行resize操作,确保输入图像符合模型的要求。<

订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



