Fisher Kernels on Visual Vocabularies for Image Categorization
论文链接:CVPR 2006
在模式分类领域,Fisher Vector(FV)是一个强有力的构架,因为他结合了生成式(概率密度函数)和判别式(分类)的优点。FV可以被理解为Bag-of-visterms的扩展。FV对于计算量的要求比较低,在一种类别上训练出来的字典可以应用到其他类别上,这样的方法在并不会产生很大的损失。
Fisher Kernel
这个似然函数能够将可变长度的X转换成具有固定长度的向量,这个向量仅仅依赖上述模型中的参数。
fisher 信息矩阵可以这样表示:
因此正则化的梯度向量可以表示为:
作者说,这个cost跟计算量和矩阵求逆相关,所以一般不会在这个地方进行normalization。(这个问题可能在2006年的时候,是个问题,现在的话(2017),应该能解决了吧)。因此这里提出了 Fλ 近似对角阵(动态范围内分维normalization),在后面可以看到使用这个矩阵可以提高task的表现。
Fisher Kernels on Visual Vocabularies
视觉词汇表使用GMM模型来表示。 X 代表从一张图片中提取的