视频处理中上下文信息的应用
1. 上下文信息在不同领域的应用概述
上下文感知在普适计算中得到了广泛研究,移动设备和分布式传感器为普适计算问题自然地提供了丰富的上下文信息。常见的上下文建模方法包括键值模型、标记方案模型、图形模型、面向对象模型、基于逻辑的模型和基于本体的模型等。不同模型各有优缺点。
在计算机视觉领域,上下文的使用主要集中在图像内部提供的上下文信息。近年来,利用上下文进行图像中的目标识别研究取得了很大进展。主要有基于场景的上下文和基于对象的上下文两种方法。
- 基于场景的上下文 :基于场景中对象背景通常具有一定结构的观察,从代表整体场景的特征中学习上下文先验,这些特征包括对象启动、注意力焦点和尺度选择等。
- 基于对象的上下文 :例如通过对象的共现、位置和外观等信息进行目标识别。先将图像分割成多个稳定的分割块,为每个分割块分配具有置信度的对象标签,学习具有对象位置和共现计数的上下文模型,最终为分割块分配对象标签,以最大化标签与分割块内容的概率以及与其他分割块的上下文一致性。
此外,上下文信息还被应用于人类活动分析,通过在检测器集合中纳入对象检测信息(如存在/不存在、数量和距离),并应用基于高斯过程和多核协方差函数的贝叶斯分类方法,自动选择和分配多个特征的权重。对于涉及对象和多人的活动,对象级信息可能比标准图像特征更具判别性。
2. 案例研究:智能家居环境发现
在智能家居环境中,安装多个摄像头,目标是自动发现家中经常使用的对象。由于许多对象外观差异大、摄像头视角不同以及环境杂乱,基于外观的对象识别具有挑战性。因此,采用观察用户与对象
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



