今天认真把Selective Search for Object Recognition这篇文章阅读完,想来写写自己的见解与想法。如果有错,希望得到大牛们的指点,谢谢!
文章一开始就提出问题:
如何判别哪些Region属于同一个物体?
对于图a,说明了物体之间可能具有的层级关系,比如碗里有个勺子;
对于图b,我们可以根据颜色来分开两只猫,但是不能根据纹理来分开;
对于图c,我们可以根据纹理来找到变色龙,但是不能根据颜色来找到;
对于图d,我们将车轮归类成车的一部分,既不是因为颜色相近,也不是因为纹理相近,因为车轮是车的一部分,且其实封闭的。
所以需要用多种策略结合,才有可能找到图片中的所有物体。
所以本文就开始提出使用Selective Search进行物体检测。并且物体之间存在层级关系,所以Selective Search用到了Multiscale的思想。
从上图中就能看出,Select Search在不同尺度下能够找到不同的物体。
读者注意了哦,这里说的多尺度是通过分割的方法将原始图片分成多个Region,然后用