多视角视频浏览的建模、结构化与动态对象逻辑建模
在多媒体技术不断发展的今天,多视角视频(MPV)数据的处理和动态对象在视频数据库中的建模变得愈发重要。下面将详细介绍多视角视频的相关处理方法以及基于逻辑的动态对象视频数据库建模方法。
多视角视频处理
计算更好捕获度
在处理 MPV 数据时,会通过比较视频对象的聚焦对象区域进行时空搜索。这种比较基于一种衡量标准,用于指示在视频区间内聚焦对象的捕获效果。然后,检索出能“更好”捕获对象的视频区间,这里的“更好”可能意味着对象被捕获得更接近用户视角,或者从相反角度捕获。
假设有两个同步的视频对象 $O_i = (F_i, A_i, K_i)$ 和 $O_j = (F_j, A_j, K_j)$,为了计算更好捕获度关系,引入了捕获条件度量。其计算分为两个步骤:
1. 计算聚焦对象区域序列的相似度 :通过比较每个时间 $t$ 对应视频帧的聚焦对象区域来计算相似度。如果一个聚焦对象区域的中心包含在另一个聚焦对象区域内,那么这两个帧被认为捕获了相同的目标。
2. 计算捕获条件度量 :该度量用于指示聚焦对象的捕获效果,包含以下三种构建:
- 捕获大小 :视频帧上对象的大小会根据相机的位置和焦点而变化。用户可能需要捕获更大对象的视频场景,或者捕获更宽区域的场景。捕获大小的捕获条件度量 $s$ 定义如下:
- 当对象被拍摄得更大时:$s = \frac{\min(rr)}{rr}$(如果 $rr > 1$),否则 $s = 0$
- 当对象被拍摄为相同大小时:$s
超级会员免费看
订阅专栏 解锁全文
1010

被折叠的 条评论
为什么被折叠?



