计算机视觉中的图模型应用与推理
一、链和树模型的应用
1.1 立体视觉
在立体视觉中,不同模型的表现差异显著。独立像素模型、独立扫描线模型和基于树的模型各有特点。Veksler(2005)提出的基于树的模型解决了网格模型中存在的环带来的MAP推理难题。具体操作步骤如下:
1. 修剪全网格模型 :将全网格模型修剪成树结构。每个边都有一个成本特征,如果相关像素靠近图像中的大变化,成本会增加。
2. 计算最小生成树 :使用标准方法(如Prim算法)计算最小生成树,该树倾向于保留最需要的区域中的边。
基于树的模型的MAP推理结果在两个方向上都是分段平滑的,明显优于独立像素模型或独立扫描线方法。以下是不同模型的对比表格:
| 模型类型 | 特点 | 推理效果 |
| ---- | ---- | ---- |
| 独立像素模型 | 像素独立处理 | 效果较差 |
| 独立扫描线模型 | 按扫描线处理 | 有一定局限性 |
| 基于树的模型 | 修剪成树结构 | 分段平滑,效果较好 |
1.2 图像结构模型
1.2.1 面部特征定位
图像结构模型用于对象类,例如面部模型。该模型由多个部分(如鼻子、眼睛和嘴巴)通过类似弹簧的连接组成。Felzenszwalb和Huttenlocher(2005)指出,如果部分之间的连接采用无环图(树)的形式,则可以在多项式时间内将其拟合到图像中。具体步骤如下:
1. 定义似然 :简单系统可以为每个部分
超级会员免费看
订阅专栏 解锁全文
4万+

被折叠的 条评论
为什么被折叠?



