- 操作系统:ubuntu22.04
- IDE:Visual Studio Code
- 编程语言:C++11
算法描述
这是一个计算机视觉面试中的高频核心问题,也是理解目标检测算法体系的关键。
我们从原理、结构、速度、精度、适用场景等维度,系统对比:
🧠 一、基本概念
| 类型 | 代表模型 | 核心思想 |
|---|---|---|
| 两阶段检测器(Two-stage) | Faster R-CNN, R-CNN, Fast R-CNN | 先“提名”可能包含目标的区域(Region Proposal),再对每个区域进行分类和精修坐标 |
| 单阶段检测器(One-stage) | YOLO系列, SSD, RetinaNet | 直接在特征图上密集预测边界框和类别,一步到位 |
💡 可以类比:
两阶段 = “先找可疑区域,再仔细检查”
单阶段 = “一眼扫过去,直接报结果”
二、结构对比(以 Faster R-CNN vs YOLOv5 为例)
✅ Faster R-CNN(两阶段)结构:
- Backbone(如 ResNet)→ 提取特征图
- RPN(Region Proposal Network) → 生成候选框(约2000个)

最低0.47元/天 解锁文章
541

被折叠的 条评论
为什么被折叠?



