YOLO(You Only Look Once)神经网络算法具有以下几个创新点:
**一、统一的检测框架**
1. **单阶段检测**
- 传统的目标检测算法大多是两阶段的,例如R - CNN系列(先提取候选区域,再进行分类和回归)。而YOLO采用单阶段检测,直接在整张图像上进行特征提取并同时预测目标的类别和位置。这使得检测速度大大提高,能够满足实时性要求较高的应用场景,如视频监控中的实时目标检测。例如,在交通监控中,实时检测道路上的车辆、行人等目标,YOLO能够快速给出结果,而两阶段算法可能会因为处理速度慢而错过一些关键信息。
2. **端到端的网络结构**
- YOLO的网络结构是端到端的,从输入图像到输出目标的类别和位置信息,中间没有复杂的中间处理环节。这种结构简化了目标检测的流程,减少了因为中间环节可能带来的误差积累。它将目标检测任务看作一个回归问题,直接学习输入图像到输出目标信息的映射关系。
**二、高效的特征提取与网格划分**
1. **特征金字塔网络(FPN)的应用(在YOLOv3及后续版本)**
- FPN结构在YOLO中的应用是一个重要创新。它通过融合不同尺度的特征图,使得网络能够检测到不同大小的目标。在图像中,小目标可能只在低分辨率的高层特征图中有较好的表示,而大目标在高分辨率