Large-Scale Query-by-Image Video Retrieval Using Bloom Filters
使用图片从数据库中搜索视频,要实现在大规模数据中应用的话,为数据库中视频的每一帧建索引是不实际的。论文的主要贡献是使用了基于Bloom Filter的框架,可以为长的视频段建立索引,能够实现高效的以图搜视频。
系统的框架如下:
场景:平均2-8分钟,相当于视频中的一个小故事。
镜头:平均3-8秒
实现的是图-场景的搜索,主要的贡献是:
1. 提出一种新的基于场景的描述子,将费舍尔向量和Bloom filters相结合,能够提升24%的准确率和4倍的速度。
2. 对不同特征和Bloom filter的哈希模式做了研究,表明point-indexed的描述子加上quantizer-based hashes能够提供最好的性能。
3. 使用三个数据集进行了大规模的实验(都使用倒排索引进行检索)