1. 论文基本信息
- 论文标题:Discriminative Correlation Filter with Channel and Spatial Reliability
- 作者:Alan Lukezic等
- 出处:CVPR,2017
- 文章链接:https://arxiv.org/abs/1611.08461
- 补充材料:https://www.semanticscholar.org/paper/Discriminative-Correlation-Filter-with-Channel-and-Luke%C5%BEi%C4%8D-Voj%C4%B1-%C5%99/7b485979c75b46d8c194868c0e70890f4a0f0ede
- 源码链接:https://github.com/alanlukezic/csr-dcf
这篇笔记主要针对滤波器求解的推导过程进行分析(拉格朗日乘子法),主要参考内容是原文的补充材料,关于论文其他部分创新点及其整体思路会在后续文章中进行分析。(笔记1的链接:http://blog.youkuaiyun.com/discoverer100/article/details/78182306)
2. 滤波器求解目标函数的构建
在多通道情况下,目标函数为
其中, h h 表示滤波器, d=1toNd d = 1 t o N d 表示 Nd N d 个通道, g g 表示期望的响应输出, λ λ 表示正则项用于防止过拟合(关于正则项为什么可以防止过拟合可以参考: http://www.cnblogs.com/alexanderkun/p/6922428.html)
根据上述(1)式,为简化推导过程,将多通道情况改为单通道情况模式,则目标函数为
引入变量 hc h c 并定义约束条件
其中, hm≡m⊙h h m ≡ m ⊙ h ,而 m m 表示论文中的空间置信图(spatial reliability map),也可以理解为一个mask,具体概念可以参考前面的一篇文章: http://blog.youkuaiyun.com/discoverer100/article/details/78182306,上述(3)式中引入的变量 hc h c 可以先不理会其物理意义,它的主要作用是让算法能够收敛(论文原文表述:prohibits a closed-form solution),个人猜测:这里的下标命名为c,可能就是取constrained的第一个字母。
对(2)式引入上述约束条件,并进一步调整,得到最终的目标函数
上述的正则项前面多出了一个系数 1/2 1 / 2 ,其主要意图是求导数后系数可以变为 1 1 ,便于公式书写。
这样,公式(4)就是我们推导的起始表达式。
3. 构建Lagrange表达式
根据上述目标函数,以及Augmented Lagrangian方法(参考Distributed optimization and statistical learning via the alternating direction method of multipliers),构建Lagrang表达式,如下
其中,字母 I I 表示Lagrange乘数,字母上面的横杠表示 共轭矩阵,字母右上方的 H H 表示 共轭转置矩阵,因此有规律: (后面的推导中可能同时存在两种表示,需要留意)。将上述(5)式进行向量化表示,可得
不难看出,上述(5)式到(6)式,主要变化就是将变量 h^m h ^ m 的表达式替换为 D−−√FMh D F M h ,其中 F F 表示离散傅里叶变换矩阵,它相当于一个常量, 是 F F 的大小( 是一个 D×D D × D 的方阵), M=diag(m) M = d i a g ( m )
将上述(6)式简单表述为四个项的和,为
其中,
4. 开始优化,首先对h_c求偏导数
对上述公式(4)的优化可以表述为下面的迭代过程
现在看关于变量 h^c h ^ c 的优化,需要令满足 ∇