【论文阅读笔记】Adaptive Color Attributes for Real-Time Visual Tracking

CCSK: 颜色增强的目标跟踪
本文介绍了一种名为CCSK的目标跟踪算法,它是CSK算法的扩展,利用颜色信息提升跟踪精度。CCSK将RGB颜色空间转换为11维颜色空间,并通过PCA降维至2维,以解决高维颜色特征带来的计算复杂性问题。该方法在光照变化、遮挡和背景杂乱等情况下的表现优于原CSK。

论文发布时间:2014年

全文概括

  CCSK,是CSK的扩展。CKS只用了灰度图的信息进行训练,而CCSK多了一个color,即使用了颜色信息进行训练。作者进一步将RGB颜色空间映射到了11维彩色空间,分别为black, blue, brown, grey, green, orange, pink, purple, red, white and yellow。在每个通道单独处理后,结果进行融合。但由于11维的运算复杂度太大,所以用PCA降维到2维后进行处理。(目标识别和检测受益于颜色信息的使用,这也是在目标跟踪上使用颜色信息的一个原因)

  在增加了颜色属性之后,CCSK 相较于 CSK,能对更多情况进行处理,比如:光照变化,遮挡,非刚性形变,运动模糊,平面内旋转,出平面旋转和背景杂乱;CCSK 也有不足的地方,比如:尺度变化,快速运动,出视角和低分辨率,等视频的跟踪效果不佳。


简介

  视觉对象跟踪问题,会受到光照变化、部分遮挡、背景杂乱和形变等因子影响。在本文中,作者认为,颜色的使用能缓解其中的一些问题,增加鲁棒性。


Coloring Visual Tracking

Color Attributes for Visual Tracking

  颜色属性,或者颜色名字(CN, color name),是人类定义的颜色语言标签,其代表世界的颜色。语言学家的研究表明,英语包含十一种基础颜色:黑色、蓝色、棕色、灰色、绿色、橙色、粉红色、紫色、红色、白色和黄色。
  计算机视觉中,颜色表示为RGB形式,即三种颜色标签。这里将RGB值映射到11维的颜色代表概率上,其概率和为1。这个映射过程是通过 RGB 每个维度的值,通过计算得到一个值,映射到11维颜色空间的一个下标,选择离散的11维颜色表达。

  传统的CSK跟踪器将灰度值正则化到[−0.5,0.5][-0.5,0.5][0.5,0.5]区间,这能抵消掉窗口操作带来的失真,那会影响到核的L2L^2L2距离。在彩色空间上,作者实验了两种正则化方法:1)1)1) 每个颜色维度减去111\frac1{11}111这将映射颜色空间到10维子空间,因为所有的颜色维度值加起来为0002)2)2) 直接将11维颜色空间映射到10维的正交基子空间中,这在让颜色空间居中的同时,将维度从11维减少到10维。

Robustifying the Classifier for Color Features

  CSK 包括学习的表现 x^\hat{x}x^ 和变换的分类器系数 AAA。其方法在线更新分类器系数:Ap=(1−γ)Ap−1+γAA^p=(1-\gamma)A^{p-1}+\gamma AAp=(1γ)Ap1+γA其中那个,ppp是第ppp帧的指数,γ\gammaγ是学习率参数。这将导致次优解,因为其只考虑了当前帧 x^\hat{x}x^。与CSK不同的是,MOSSE跟踪器考虑了之前所有帧,却只是线性处理(平均)

  原来的损失函数为:ϵ=∑m,n∣&lt;ϕ(xm,nj),w&gt;−y(m,n)∣2+λ&lt;w,w&gt;\epsilon=\sum_{m,n}|&lt;\phi(x^j_{m,n}), w&gt;-y(m,n)|^2+\lambda&lt;w,w&gt;ϵ=m,n<ϕ(xm,nj),w>y(m,n)2+λ<w,w>原来的系数aaa的向量AAA的解为:A=F{a}=YUx+λA=\mathcal{F}\{a\}=\frac{Y}{U_x+\lambda}A=F{a}=Ux+λY在本文损失函数变为:ϵ=∑j=1pβj(∑m,n∣&lt;ϕ(xm,nj),wj&gt;−yj(m,n)∣2+λ&lt;wj,wj&gt;)\epsilon=\sum^p_{j=1}\beta_j(\sum_{m,n}|&lt;\phi(x^j_{m,n}),w^j&gt;-y^j(m,n)|^2+\lambda&lt;w^j,w^j&gt;)ϵ=j=1pβj(m,n<ϕ(xm,nj),wj>yj(m,n)2+λ<wj,wj>)其中wj=∑k,la(k,l)ϕ(xk,lj)w^j=\sum\limits_{k,l}a(k,l)\phi(x_{k,l}^j)wj=k,la(k,l)ϕ(xk,lj),这个损失函数的最小化的解为:Ap=∑j=1pβjYjUxj∑j=1pβjUxj(Uxj+λ)A^p=\frac{\sum\limits_{j=1}^p\beta_jY^jU^j_x}{\sum\limits_{j=1}^p\beta_jU^j_x(U^j_x+\lambda)}Ap=j=1pβjUxj(Uxj+λ)j=1pβjYjUxj

  则更新方案变为:ANp=(1−γ)ANp−1+γYpUxpA^p_N=(1-\gamma)A_N^{p-1}+\gamma Y^pU_x^pANp=(1γ)ANp1+γYpUxpADp=(1−γ)ADp−1+γUxp(Uxp+λ)A_D^p=(1-\gamma)A_D^{p-1}+\gamma U^p_x(U_x^p+\lambda)ADp=(1γ)ADp1+γUxp(Uxp+λ)x^p=(1−γ)x^p−1+γxp\hat{x}^p=(1-\gamma)\hat{x}^{p-1}+\gamma x^px^p=(1γ)x^p1+γxp其中,Uxj=F{Uxj}U_x^j=\mathcal{F}\{ U_x^j\}Uxj=F{Uxj}是核输出,uxj(m,n)=k(xm,nj,xj)u_x^j(m,n)=k(x^j_{m,n},x^j)uxj(m,n)=k(xm,nj,xj)βj\beta_jβj通过学习率参数γ\gammaγ设定;Ap=ANpADpA^p=\frac{A^p_N}{A^p_D}Ap=ADpANp

Low-dimensional Adaptive Color Attributes

  已知CSK跟踪器的计算时间和特征维度成线性关系。所以对于高维度的颜色调整,这是一个 problem。
  所以,作者通过 PCA 技术进行维度缩减,从11个维度中选择最重要两维。其具体实现,也通过指数平均学习了之前的颜色表示,以防止颜色的大尺度变化。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值