57、大规模文本到图像检索及最大后验核分类器的研究

大规模文本到图像检索及最大后验核分类器的研究

大规模文本到图像检索的贝叶斯K邻域模型

在文本到图像检索领域,贝叶斯方法和朴素贝叶斯分解查询得出所需分数的表达式:
[sc(q, p) = \sum_{i=1}^{n} \left[\beta \frac{1}{K_{max}} \sum_{K=1}^{K_{max}} \frac{C_{Ki}}{K} + (1 - \beta) \frac{1}{|d|} \right]]

计算问题

为实现良好的计算性能和可扩展性,需考虑以下计算问题:
1. 区分训练和测试图像 :训练图像已知一组训练查询的相关性判断,而测试图像则无。在实际场景中,已知描述的图像数量相对总图像数量较少,但目标是对所有图像进行检索。训练图像用于定义集合 (P_{i}^{+}),对于测试图像 (p),需估计词汇表中任何单词的条件概率 (p(w_{i} | p)),该概率在训练时估计并存储在表中,测试时通过表中对应查询词和特定图像位置的值相乘计算得分 (sc(q, p))。
2. 高效计算 (p(w_{i} | p)) :这涉及两个重要部分,一是为词汇表中每个单词 (w_{i}) 获取集合 (P_{i}^{+}),二是计算任何图像 (p) 的 (K) 邻域。计算邻域是最耗时的部分,需获取 (p) 与所有训练图像的距离,可使用快速搜索算法减轻此任务。根据数据集不同,最终使用了两种方法:视觉词哈希(VWH)和局部敏感哈希(LSH),使用快速搜索算法的方法记为 FKNIR(Fast KNIR)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值