视频处理中的行为建模、异常检测与上下文信息应用
在视频处理领域,准确识别正常与异常行为以及有效利用上下文信息进行内容解读是重要的研究方向。本文将围绕行为建模与异常检测方法,以及上下文信息在视频处理中的应用展开探讨。
行为建模与异常检测
基本概念与符号表示
在视频序列分析中,传统的逐像素分析难以捕捉两个像素间活动模式所产生的正常或异常行为。例如,像素A在像素B之前出现活动爆发,意味着有车辆从左向右行驶。
为了便于后续分析,我们引入一些符号表示。设$I_{\vec{x},k}$为在大小为$W_0 × H_0$的二维网格上离散时间$k$采样的视频序列的亮度(或颜色),其中$\vec{x} \in W_0 × H_0 \subset R^2$,$k \in Z^+$。为简化符号,用$s$表示时间$t$时的像素位置$\vec{x}$。通过简单的背景减法估计运动标签$X_s$,$X_s \in {0, 1}$,0和1分别表示“非活动”和“活动”状态。以$s = (\vec{x},t)$为中心的运动标签序列定义为$\vec{X} {\vec{x},t} = [X {\vec{x},t - \eta},…,X_{\vec{x},t + \eta}]$,其中$2\eta + 1$是向量$\vec{X}_s$的长度。整个时空序列可以在大小为$W_0 × H_0 × T_0$的三维网格$S$上定义,$s \in S$是时空空间中的一个点,$I_s$是相应的亮度(或颜色),$X_s$是相应的运动标签。
对于每个像素$\vec{x}$在时间$t$,考虑以$s = (\vec{x},t)$为中心的时空邻域$M_s$,它是一个大小为$W × H
超级会员免费看
订阅专栏 解锁全文

6041

被折叠的 条评论
为什么被折叠?



