基于自适应纹理和边界编码的自然图像分割
1 自适应纹理和边界编码
1.1 构造纹理向量
在自然图像分割中,构造能代表图像片段中均匀纹理的纹理向量是关键的一步。具体操作如下:
- 颜色空间转换 :将RGB格式的图像转换为L∗a∗b∗颜色空间,因为该颜色度量能更好地近似感知均匀颜色空间。
- 特征构造 :以像素p为中心,取w×w的邻域Ww(p),将图像I中每个像素的w - 邻域取出,并将每个窗口堆叠成列向量,构建特征集X:
[X = {x_p \in R^{3w^2} : x_p = W_w(p)S, p \in I}]
- 降维处理 :为便于计算,将特征集X投影到其前D个主成分上,降低维度。实验发现,许多自然图像的X的前八个主成分包含了超过99%的能量,因此这里选择D = 8,降维后的特征集记为ˆX。
在建模自然图像纹理的众多方法中,高斯网格马尔可夫模型(MMM)在纹理编码方面表现出色。不过,要确定MMM样本的最优压缩率,需知道其率失真函数,但该函数难以估计。由于高斯分布在相同方差的所有分布中具有最高的率失真,是压缩的最坏情况分布,所以使用高斯分布的率失真可得到MMM真实编码长度的上界。
通过实验比较RGB和L∗a∗b∗颜色空间中均匀纹理区域的特征窗口与高斯分布的拟合度。使用手动分割的BSD图像作为训练数据,对每个区域的特征向量进行参数和非参数建模。参数模型Q是通过最大似然估计样本得到的多元正态分布,非参数模型P通过核密度估计获得。利用KL散度DKL(P ∥Q)衡量分布的非高斯性,结果表明L∗a∗b∗颜色空
超级会员免费看
订阅专栏 解锁全文
7675

被折叠的 条评论
为什么被折叠?



