本文相关
Paper Summary:https://github.com/FDU-VTS/CVPaperCode:https://github.com/FDU-VTS/CVCode
原文链接
基础知识
- 一张图是由不同的像素点构成的,本文的计算和构建都是基于像素点的运算,即
(RGB)值 - 高斯模糊/拉普拉斯变换:用于转换图像,减少图像噪声的平滑算法
- 最小生成树
(Minimum Spanning Tree | MST)指的是,在图中建立一个连通图并且没有回路是生成树,而最小生成树指的是构成结果权值最小 - 不同像素点之间的差:即
RGB值之间的欧氏距离- ( R 1 − R 2 ) 2 + ( G 1 − G 2 ) 2 + ( B 1 − B 2 ) 2 \sqrt{(R_1-R_2)^2+(G_1-G_2)^2+(B_1-B_2)^2} (R1−R2)2+(G1−G2)2+(B1−B2)2
- 并查集算法(union find set)以及克鲁斯卡尔算法(Kruskal),使用边建立并查集,并且使用kruskal进行搜索合并
早期的分割方法
- Zahn提出了一种*基于图的最小生成树(MST)*的分割方法,用来进行点聚类以及图像分割,前者权值是点间距离,后者权值是像素差异。
- 不足:根据阈值不同,会导致高可变性(大约是色彩对比强的一个区域)区域划分为多个区域;将ramp和constant region合并到一起。
- Urquhart提出用边相连的点中边权值最小的进行归一化,找周围相似的。
- 根据各个区域是否符合某种均匀性标准来分割,找均匀强度或梯度的区域,不适用于某个变化很大的区域。
- 使用特征空间聚类:通过平滑数据——给定半径的超球面对各个点扩张其连通分量,找到簇,来保持该区域的边界,并对数据进行转换。
基于图的分割
定义
G:将图像由像素点转化为图V:每一个像素点都是图中的点E:任意两个相邻像素点之间边C:被划分的Segmentation,一个C中有至少1个像素点Int(C):区域内最小生成树权值最大的边,表示的是,记为- I n t ( C ) = max w ( e ) , e ∈ M S T ( C , E ) Int(C) = \max{w(e)} , e∈MST(C,E) Int(C)=maxw(e),e∈MST(C,E)
Dif(C1,C2):表示C1和C2之间的距离,记为- D i f ( C 1 , C 2 ) = min w ( v i , v j ) , v i ∈ C 1 , v j ∈ C 2 , ( v i , v j ) ∈ E Dif(C1,C2) = \min{w(vi,vj)} ,vi∈C1,vj∈C2,(vi,vj)∈E Dif(C1,C2)=minw(vi,vj

最低0.47元/天 解锁文章
2095

被折叠的 条评论
为什么被折叠?



