文章目录
深度学习的目标检测算法,通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标,并调整(回归)区域边界,从而更准确地预测目标的真实边界框(
ground-truth bounding box)。
目标检测算法会需要做两个事情:
- 推荐区域框是否有目标
(positive or negative),是分类任务; - 调整这些区域框,不断逼近到目标真实框,是回归任务。
就针对目标检测算法的传统区域框推荐和深度学习的方法,问了chatGPT,他给出了下面的回答。给与我们借鉴,帮助我们理解。

传统的目标框推选方法,我们暂时就先不考虑。针对基于anchor的方法,我们通过最常用的anchor based(anchor box)和anchor free,和no anchor来展开。
一、什么是Anchor
anchor也叫做锚,预先设置目标可能存在的大概位置,然后再在这些预设边框的基础上进行精细化的调整。而它的本质就是为了解决标签分配的问题。
本文深入探讨了目标检测中的Anchor技术,包括Anchor based(如Faster R-CNN)的原理、优缺点,Anchor free方法的引入及其优势与挑战,以及no anchor方案的灵活性。文章分析了三种方法在预设尺寸、预测过程和网络结构上的差异,强调了它们在不同应用场景下的选择考量。
订阅专栏 解锁全文
8834

被折叠的 条评论
为什么被折叠?



