计算机视觉领域中,目标检测技术历经数十年演进,已从传统滑动窗口+手工特征的模式,转向深度学习主导的智能时代。早期的R-CNN系列算法通过选择性搜索生成候选区域,结合CNN特征提取与SVM分类,奠定了两阶段检测框架的基础。后续改进中,SPP-Net引入空间金字塔池化,Fast R-CNN实现特征共享,Faster R-CNN以区域建议网络(RPN)替代传统候选生成,推动端到端训练。
然而,两阶段方法的计算成本催生了单阶段算法的突破。YOLO系列通过网格划分直接回归目标位置与类别,SSD融合多尺度特征图,实现速度与精度的平衡。近年兴起的无锚框(Anchor-Free)技术,如FCOS、DETR等,通过全卷积网络预测目标边界或关键点,进一步简化流程,降低超参数依赖。当前研究聚焦于小目标检测、实时视频处理及边缘设备部署,稀疏注意力机制与硬件协同优化成为新方向。未来,无监督学习与未知类别检测或将重塑目标检测范式。
07-24
439

07-24
362
