1. 基础概念
- 图像分类(Classification)
图像分类是给定一张图片,我们希望程序可以识别图片中的物体。比如,我们构造一个分类器,来识别图片中的物体是猫或是狗,这是图像分类技术。如下图所示,给定一张图片,分类器给出图片中物体的类别:

2. 定位(Localization)
通过以上图片分类算法后,我们知道图片中物体的类别,但是还不知道物体在图片中的位置。定位算法允许我们识别物体的位置。Classification with Localization算法不仅能识别图片中物体的类别而且可以得到物体在图片中的位置,通常图片中只有一个物体。而Detection算法主要场景是一张图片中有多个物体,需要识别定位所有的物体的类别和位置。下图说明了分类算法、定位算法和Detection算法的区别:


本文介绍了对象检测的基础概念,包括图像分类、定位和检测的差异。详细阐述了滑动窗口对象检测算法的工作原理及缺点,并讨论了YOLO(You Only Look Once)算法的优势,如何通过分类定位每个子区域来提高效率,以及解决多个物体在同一子区域内的策略。
最低0.47元/天 解锁文章
528

被折叠的 条评论
为什么被折叠?



