数字轮廓重建与形状描述方法解析
1. 数字轮廓重建算法
1.1 目标函数与GLP问题
在数字轮廓重建中,涉及到两种目标函数 $\omega_D$ 和 $\omega_P$。
-
目标函数 $\omega_D$
:若问题不可行,则返回 $\Omega$;否则返回集合 $H$ 的最小分隔圆盘的半径。并且,$(H, \omega_D)$ 满足单调性条件(C1),即约束集越大,该集合的最小分隔圆盘越大。由于 $n \geq 1$,若最小分隔圆盘存在,则是唯一的,这意味着满足局部性条件(C2)。
-
目标函数 $\omega_P$
:若问题不可行,返回 $\Omega$。否则,由于 $n \geq 1$,要包围的点集和不包围的点集的凸包是明确定义且不相交的,此时 $\omega_P$ 返回这两个凸包之间最小距离的倒数。取倒数是为了使添加非冗余约束时目标函数增大。同样,$(H, \omega_P)$ 也满足条件(C1)和(C2)。
根据不同的 $\omega_X$,需要解决两种不同类型的广义线性规划(GLP)问题。
1.2 解决GLP问题的算法
存在一种易于实现的随机算法,能在期望线性时间内解决这两种GLP问题。该算法源于求解最小包围圆问题的著名随机算法,它接受一个对 $(H, \omega_X)$ 并返回一个基,即一个最小子族 $B \in H$,使得 $\omega_X(B) = \omega_X(H)$。问题的组合维度 $d$ 是任何可行族的任何基的最大大小,例如对于 $\omega_D$(或 $\omega_P$),$d = 3$,因为最多三个约束可以唯一地定义一个圆盘(或两个凸多边形之间的宽度)。
算法是增量和递归的,其大致步骤如下:
1. 迭代添加约束。
2. 对于每个约束,检查新约束是否违反当前基。
3. 如果违反,则通过递归调用相同算法并使用所有先前的约束来尝试从新约束更新基。
1.3 在线算法及其实验结果
为了计算最大线段或弧的整个集合,使用在线算法是很有用的。由于原始算法是增量的,按顺序添加约束可直接得到一个在线算法。但缺点是随机顺序只能在递归调用中使用,而在约束发现过程中不能使用,这导致期望时间复杂度从线性增加到二次。不过,实验观察到运行时间较短。
在实验中,对花朵图像进行处理,与之前纯矢量化的工作不同,通过输入轮廓的循环不规则表示,能够重建由一维区间界定的最大基元,其长度仅取决于局部输入噪声,无需任何参数即可获得噪声形状的忠实表示,且结果不依赖于任何起始点。即使在局部噪声较大的情况下,算法也能成功重建基元集合。对于真实图像如字符图像和标志图像,算法也能准确表示轮廓,相比之前的方法有更好的效果。
1.4 实验结果展示
| 图像名称 | 特点 | 处理效果 |
|---|---|---|
| 花朵图像 | 有噪声 | 能重建最大基元,长度仅依赖局部噪声,结果不依赖起始点 |
| 字符图像 | 轮廓有噪声 | 准确表示轮廓,最大基元能完整呈现 |
| 标志图像 | 尺寸 350×350 像素 | 处理大量有意义的框,展示了方法的可扩展性 |
2. 形状描述的距离轮廓方法
2.1 引言
在计算机视觉任务中,形状是用于描述和区分对象的常用特征。形状描述符应具有对形状变换、扭曲和遮挡的不变性,并且独立于应用且计算复杂度低。形状描述符可分为基于区域和基于边界(轮廓)的方法,每种方法又可进一步分为结构和全局方法。
本文提出的距离轮廓是用于无孔二维形状的基于边界的描述符,它可以对形状进行全局描述,也能根据拓扑持久性区间将形状划分为段。介绍了两种距离轮廓:欧几里得距离轮廓(DP)和测地距离轮廓(DP∗)。
2.2 相关技术现状
距离轮廓与拓扑形状描述符、形状签名和谱描述符相关。
-
拓扑形状描述符
:如拓扑持久性用于形状描述的大小函数、持久性条形码、Reeb图等。但这些方法通常依赖于过滤过程,例如高度函数作为过滤依据时不具有旋转不变性,代表性不足。
-
形状签名
:是从形状边界导出的一维函数,包括质心轮廓、复坐标、质心距离、切线角、累积角、曲率、面积和弦长等。形状签名对边界噪声敏感,考虑极值的持久性可以过滤噪声,使距离轮廓对边界噪声具有不变性。
-
谱描述符
:如傅里叶描述符(FD)和小波描述符(WD),通常从形状签名的谱变换导出,通过在谱域分析形状来克服边界噪声问题。
2.3 LBP尺度空间回顾
局部二值模式(LBP)最初于1996年用于纹理分类。LBP通过比较中心像素 $g(p)$ 和沿以 $P$ 个点 $q_i$ 子采样的圆上的灰度值 $g(q_i)$ 得到一个位模式 $BP$:
[
BP(q_i) =
\begin{cases}
1, & \text{如果 } g(p) - g(q_i) \geq 0 \
0, & \text{否则}
\end{cases}
]
两个参数决定LBP的计算:$r$ 定义围绕 $p$ 的圆形邻域的半径,$P = |BP|$ 固定圆上的采样点数,即位模式 $BP = (s_1, s_2, \ldots, s_P)$ 的位数。
LBP可用于描述二进制图像区域围绕参考点 $p$ 的局部拓扑,根据位模式中从0到1以及从1到0的过渡次数可以定义LBP类型:
- (局部)最大值:无过渡,位模式仅包含0且 $g(p) = 1$。
- (局部)最小值:无过渡,位模式仅包含1且 $g(p) = 0$。
- 平台:无过渡,位模式仅包含1且 $g(p) = 1$。
- 斜率:两个过渡(与均匀模式比较)。
- 鞍点:四个或更多过渡。
LBP特征的持久性通过空间的过滤来测量,过滤是“一个从空集开始到完整空间结束的嵌套子空间序列”。基于LBP的过滤可以通过为固定参考点 $p$ 和边界 $B$ 改变LBP计算的半径 $r$ 来实现,改变 $r$ 对应于沿边界 $B$ 的移动,这个过滤过程会改变圆 $c$ 与边界 $B$ 的交点,即位模式 $BP$(过渡次数),从而影响拓扑LBP类型。
LBP尺度空间是从形状内的选定参考点 $p$ 基于LBP进行过滤得到的,过滤可以从半径 $r = 0$ 开始,根据预定义的采样方案增加半径(对于离散情况,$r$ 增加1覆盖所有整数半径)。对于形状描述符,存储每个LBP半径观察到的过渡次数,即局部拓扑的变化。除了分类或识别应用外,LBP尺度空间在扩展极坐标后可以实现形状的重建。
2.4 距离轮廓的提出
LBP尺度空间的暴力计算是从一个小圆圈开始,计算其与形状边界的交点,然后增加LBP圆的半径并再次计算交点,重复此过程直到形状完全在LBP圆内。这种实现方式计算成本高,因此提出基于距离轮廓的定义来更有效地计算LBP尺度空间。
首先,计算形状边界 $B$ 上所有点 $b_i$ 到参考点 $p$ 的距离 $d$:
[
DP(b_i, p) = ||b_i - p||, \quad b_i, p \in \Re^2
]
下面是距离轮廓计算的流程图:
graph TD;
A[开始] --> B[选择参考点p];
B --> C[获取形状边界B上的点bi];
C --> D[计算bi到p的距离DP(bi, p)];
D --> E[完成所有点的距离计算];
E --> F[结束];
距离轮廓的提出为形状描述提供了一种更高效的方法,在后续部分将进一步探讨其局部极值以及如何在距离轮廓上定义持久性等内容。同时,还会展示对离散形状的距离轮廓的首次实验结果。
2.5 距离轮廓的局部极值与持久性
2.5.1 局部极值的定义
在计算得到距离轮廓 $DP(b_i, p)$ 后,可以分析其局部极值。局部极值是距离轮廓中的重要特征,它反映了形状边界相对于参考点的特殊位置。例如,局部最大值可能表示形状边界上距离参考点最远的点,而局部最小值可能表示最近的点。
对于边界上的点 $b_i$,如果满足 $DP(b_{i - 1}, p) < DP(b_i, p) > DP(b_{i + 1}, p)$,则 $b_i$ 为局部最大值点;如果满足 $DP(b_{i - 1}, p) > DP(b_i, p) < DP(b_{i + 1}, p)$,则 $b_i$ 为局部最小值点。
2.5.2 持久性的定义
距离轮廓的持久性是指局部极值在不同尺度下的稳定性。通过分析持久性,可以过滤掉边界上的噪声,因为噪声产生的局部极值通常具有较短的持久性。
持久性的计算可以通过以下步骤实现:
1. 对距离轮廓进行排序,得到局部极值点的序列。
2. 对于每个局部极值点,记录其“出生”和“死亡”的尺度。“出生”尺度是指该极值点首次出现的尺度,“死亡”尺度是指该极值点消失的尺度。
3. 计算每个局部极值点的持久性,即“死亡”尺度与“出生”尺度之差。
2.5.3 持久性的应用
通过分析持久性,可以对距离轮廓进行修剪,去除那些持久性较短的局部极值点,从而减少噪声的影响。以下是修剪距离轮廓的步骤:
1. 设定一个持久性阈值 $T$。
2. 遍历所有局部极值点,对于持久性小于 $T$ 的极值点,将其从距离轮廓中移除。
3. 得到修剪后的距离轮廓,该轮廓对边界噪声具有更强的鲁棒性。
2.6 欧几里得距离轮廓与测地距离轮廓
2.6.1 欧几里得距离轮廓
欧几里得距离轮廓(DP)是通过计算形状边界上每个像素到参考点的欧几里得距离得到的。它适用于刚性物体的形状描述,因为欧几里得距离在刚性变换下是不变的。
欧几里得距离轮廓的优点是计算简单,直接反映了边界点与参考点的空间距离关系。但对于铰接或可变形的形状,欧几里得距离轮廓可能无法准确描述形状的特征。
2.6.2 测地距离轮廓
为了处理铰接或可变形的形状,提出了测地距离轮廓(DP∗)。测地距离是通过结合每个边界像素到形状中轴上最近像素的欧几里得距离和沿形状中轴到参考点的测地距离来测量的。
测地距离轮廓的计算步骤如下:
1. 计算形状的中轴。
2. 对于边界上的每个像素 $b_i$,找到中轴上最近的像素 $m_i$。
3. 计算 $b_i$ 到 $m_i$ 的欧几里得距离 $d_{euclidean}(b_i, m_i)$。
4. 计算 $m_i$ 沿中轴到参考点 $p$ 的测地距离 $d_{geodesic}(m_i, p)$。
5. 测地距离轮廓 $DP^*(b_i, p) = d_{euclidean}(b_i, m_i) + d_{geodesic}(m_i, p)$。
测地距离轮廓的优点是对变形和铰接具有不变性,并且通过分析轮廓中的极值的持久性,可以修剪掉虚假的分支,提高对边界噪声的鲁棒性。它特别适用于生物学等领域中铰接或可变形物体的形状描述。
2.7 首次实验结果
在对离散形状的距离轮廓进行首次实验中,分别计算了欧几里得距离轮廓和测地距离轮廓。实验结果表明,距离轮廓能够有效地描述形状的特征。
对于刚性物体,欧几里得距离轮廓能够准确地反映形状的边界特征,并且对旋转和平移具有不变性。对于铰接或可变形的物体,测地距离轮廓能够更好地适应形状的变化,并且通过持久性分析可以有效地过滤掉噪声。
以下是实验结果的简单总结:
| 形状类型 | 适用距离轮廓 | 实验效果 |
| ---- | ---- | ---- |
| 刚性物体 | 欧几里得距离轮廓(DP) | 准确反映边界特征,对旋转和平移不变 |
| 铰接或可变形物体 | 测地距离轮廓(DP∗) | 适应形状变化,通过持久性过滤噪声 |
3. 总结与展望
3.1 总结
本文介绍了两种重要的技术:数字轮廓重建算法和形状描述的距离轮廓方法。
在数字轮廓重建方面,通过定义目标函数 $\omega_D$ 和 $\omega_P$,将问题转化为广义线性规划(GLP)问题,并使用增量和递归的算法在期望线性时间内求解。通过在线算法可以计算最大线段或弧的整个集合,实验结果表明该算法在合成和真实图像上都能取得良好的效果,能够重建噪声形状的忠实表示。
在形状描述方面,提出了距离轮廓的概念,包括欧几里得距离轮廓和测地距离轮廓。距离轮廓基于LBP尺度空间的思想,但通过更高效的计算方式实现。距离轮廓对形状的变换、变形和噪声具有较好的鲁棒性,适用于各种形状的描述,特别是测地距离轮廓在铰接或可变形物体的描述中表现出色。
3.2 展望
未来有几个研究方向值得探索:
1.
适应切向覆盖方法
:将切向覆盖方法应用于循环不规则表示,以计算包含连续基元的结构,而不是重叠的最大线段或弧。
2.
与其他方法比较
:将本文提出的方法与其他最先进的方法进行比较,并使用具有挑战性的二进制形状数据集(如KIMIA)测试它们的鲁棒性。
3.
使用其他几何基元重建
:研究使用其他几何基元(如B样条和其他参数曲线)重建数字形状的更一般问题,采用类似本文提出的框架。
通过这些研究方向的探索,有望进一步提高数字轮廓重建和形状描述的性能,为计算机视觉和图像分析领域带来更多的应用价值。
超级会员免费看
994

被折叠的 条评论
为什么被折叠?



