计算机视觉-混合动态纹理模型(Mixtures of Dynamic Textures)

本文介绍了计算机视觉领域的混合动态纹理模型(MDT),主要用于视频帧序列建模,尤其在异常事件检测中。MDT通过学习和计算负对数似然来检测异常,类似于GMM但更注重时间信息。动态纹理模型(DT)作为基础,是一个视频序列的生成模型,而MDT则是其扩展,涉及多个动态纹理成分的混合。文章详细阐述了MDT的生成过程和优化求解方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在计算机视觉领域,混合动态纹理模型(Mixtures of Dynamic Textures, MDT)常用于视频帧序列建模。比如对帧序列的分割,局部或全局的异常事件检测。下图能很好表明MDT的建模过程及其应用,该模型用于人群场景中局部异常的检测。首先,训练阶段:在一定的训练时间内且在每一个子区域中学习相应的MDT模型;其次,测试阶段:针对每一个子区域的MDT模型计算测试帧对应区域的负对数似然。整个过程类比于GMM模型用于视频建模,其中两者的区别在于GMM模型中的样本数据点为单帧中的local patch;而在MDT模型中的样本数据点多考虑了时间信息,即为spatio-temporal local patchs。而这层时间信息可以用马尔科夫链进行建模,下面我们先描述一下动态纹理模型(DT),然后再讨论MDT。
这里写图片描述

1. 动态纹理模型(DT)

DT是一个典型的视频帧序列的生成模型。这个随机过程通过一系列隐变量和观测变量 { x,y} 并结合线性动态系统(linear dynamical system, LDS)进行形式化:

{ xt+1=Axt+vtyt=Cxt+wt

其中 xtRn 为帧序列中时刻 t 对应的隐变量,刻画视频序列随时间的演变; ytRm 为对应的观测变量 (一般 nm ),刻画视频帧;参数 ARn×n 为状态转移矩阵,参数 CRm×m 为发射矩阵;而 vt,wt 为高斯白噪声,即 vtN(0,Q),wtN(0,R) ,其中 QRn×n,RRm×m 。扩展定义初始状态 x1 服从参数为 μ,S 的高斯分布。那么DT模型的参数为 Θ={ A,Q,C,R,μ,S} ,概率图模型如下图(a)所示。模型中的隐变量 yt 为连续性变量,可理解为整个模型要学习的就是视频帧的上层语义信息(即纹理信息)。该模型与隐马尔科夫模型类似,区别仅在于隐状态变量的离散型或连续性。
这里写图片描述
很显然,初始状态分布,状态转移条件分布和观测条件分布如下
p(x1)=G(x1,μ,S)p(xt|xt1)=G(xt,Axt1,Q)p(yt|xt)=G(yt,Cxt,R)
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值