这篇文章转载:http://www.bfcat.com/index.php/2012/10/iccv11-cosand/
上一篇看到的论文里提到了一篇参考文献,同样是韩国人Gunhee Kim的论文,但是是由三个牛人共同指导的,ICCV2011年的论文: “Distributed Cosegmentation via Submodular Optimization on Anisotropic Diffusion”, Gunhee Kim , Eric P. Xing, Li Fei-Fei, Takeo Kanade。
这篇论文同样是做Coseg问题的,文章的独特之处主要在于借鉴了热力学中的能量扩散理论来寻找聚类中心。论文的具体内容以及相关资料,ppt等见作者的项目主页,这里总结一下我自己比较感兴趣的地方。
1. 论文借鉴了物理学中的各向异性扩散(Anisotropic Diffusion),这一理论实际上已经被应用于计算机视觉的很多方面,例如图像分割,光流估计等等。主要的思想是将图像看作一个非均匀的金属盘,像素(或者超像素)之间的特征一致性就代表了热传导系数,分割的confidence可以看作热量或温度,分割块的中心就是热源。在图像分割中,我们就是要找到K个热源的最佳安放位置,使得整个系统具有最大能量。(实际上传感器分布的问题也可以归结为类似的思路)。
max∫x∈Ωu(x,t)dx,s.t.∂u(x,t)∂t=div(D(x)∇u(x,t)),u(g)=0,u(s)=1fors∈S,|S|
已经证明,各向异性的热传导函数 u(x,t) 是非减,且有子模性(submodularity)的函数。这就说明我们的系统可以被优化。
2. 论文在进行图像分割的时候,首先使用了普通的agglomerative clustering,也就是类似区域生长或基于树的分割方法,将图像分割成大块。然后,再利用Diversity Ranking的方式来寻找聚类中心。
Diversity Ranking的思想是,对于单张图像,我们在对采样点进行重要性排序的时候,不但要考虑其本身的数值(centrality)还要同时降低冗余,也就是考虑了diversity。

例如上图,(a)是一些采样点,我们使用欧式距离计算相似性度量,那么每个点的边界温度增益(也就是其作为分类中心的可能性)就可以在(b)中看到,温度增益就是在该点放置了热源和不放置热源,整个系统的能量差,在这里可以根据文中的式(4)进行计算。(c)中可以看出,在计算第二个中心s2的时候,由于s1处已经有了热源,所以在s1附近放置热源对整个系统的温度提升不明显,因此下一个温度增益的峰值就在s2处,以此类推。
第二行的例子也类似。具体的解释可以看论文或者ppt。
3. 因此,对于单副图像而言,在粗分割的基础上,可以用这种方式来对分割块进行排序并挑选。对于Cosegmentation而言,我们的公式有了一些变化,源的能量不再是常数,而是与其相邻图像中对应块的相似度有关(具体依然参考论文)。这样,我们在挑选分割块的时候,就同时考虑了图像见的一致性,我们可以控制图像内一致性和图像间一致性的重要性权重。

这里也是有这篇文章的另一个亮点,就是分割结果对于K的选取有一定的鲁棒性。因为在每一步选取能量增益最大的热源位置(也就是分割块的中心)时,如果能量增益很小,我们就可以停止继续添加分割中心。
我对这篇论文感兴趣的地方主要是这些,其他一些细节可以参考原论文。作者还提供了伪代码,ppt,以及部分模块的matlab程序。

本文介绍了一篇ICCV2011年关于Cosegmentation的研究,提出了利用各向异性扩散理论寻找聚类中心的方法,并通过DiversityRanking减少冗余,实现图像分割。该方法在单幅图像及图像组中均有良好表现。
4万+

被折叠的 条评论
为什么被折叠?



