基于遗传算法的查询优化与交互式卡通脸搜索的研究
在信息检索领域和搜索问题中,遗传算法及其相关策略发挥着重要作用。下面将详细介绍基于遗传算法的查询优化以及交互式卡通脸搜索的相关内容。
基于遗传算法的查询优化
在信息检索中,相关性是一个模糊的概念,因此需要在文档的排序基础上处理召回率和精确率。直接在适应度函数中使用这两个指标存在困难,例如经典的召回率测量问题。而且,如果一个染色体没有检索到相关文档,其适应度为零,会导致该染色体的基因丢失。
适应度函数设计
- 第一个适应度函数 :主要用于测试概念是否可行,针对每个查询测量召回率。设 $rd$ 为文档 $d$ 的相关性(1 表示相关,0 表示不相关),$fd$ 为文档 $d$ 的检索情况(1 表示被检索到,0 表示未被检索到)。
- 第二个适应度函数 :在第一个的基础上增加了精确率的因素,公式为 $E2 = \alpha\sum_{d} [rd * fd] / \sum_{d} [rd] + \beta\sum_{d} [rd * fd] / \sum_{d} [fd]$,其中 $\alpha$ 和 $\beta$ 是任意权重。
- 第三个适应度函数 :受 Saltan 相关性反馈工作的启发,基于向量空间模型。设 $ndc$ 为前缀形式查询中的合取项数量,$cj$ 为查询的第 $j$ 个合取项。该适应度函数定义为 $E3 = \alpha\sum_{d} [rd \sum_{j=1}^{ndc} [sim(d, cj) / ndc]] - \beta\
超级会员免费看
订阅专栏 解锁全文
9491

被折叠的 条评论
为什么被折叠?



