SLTB(2012SIGIR-baseline)

提出了一种新的个性化搜索框架,结合长短期用户行为构建用户profile,通过综合不同参数的模型,控制行为特征和衰减因子,证实了长期行为在会话开始时的重要性,短期模型随会话进展收益增加。框架在微软BING数据集上进行了验证。

在这里插入图片描述

亮点:

结合长短期用户行为构建用户profile

贡献:

  1. 提出了一个新的统一建模框架,该框架提供了个性化的不同参数的综合视图,并控制了关键方面,如行为生成的特征和使用的衰减因子
  2. 确认了这样的直觉:长期行为在会话开始时是有用的,而短期模型会随着会话的进行而产生收益。
  3. 提供关于搜索个性化的新发现,例如会话中第一个查询的特殊属性,以及学习为每个查询组合短期和长期功能的模型的强大性能,而不是简单地聚合所有特征;表明单个查询从短期和长期个性化中得到不同的好处。

个性化框架

在这里插入图片描述

图1说明了构成框架的三个时态视图之间的关系。该图还显示了当前查询的位置。为了捕捉用户当前的焦点,可以只基于最近的交互来构建一个模型。在本研究中采用的一种方法是研究session交互。考虑用户在当前会话之前与搜索引擎的历史交互,可能包括许多天或数周的活动。这种长期信息可能有助于消除不明确查询的歧义,方法是优先选择已知用户感兴趣的主题的结果。由于信息查找任务可能会扩展到多个session,当前session可能与以前的session相关。这意味着一种模式,可以在一个不断变化的时间窗口内汇总所有历史,有效地将短期和长期利益结合起来。

框架评估

给定用户发出查询q,从用户过去搜索交互的时间视图来看,view(uIu_IuI),可以考虑所有相关的查询related(qqq,uIu_I

在计算机科学领域,特别是搜索引擎评估方面,SIGIR-AP通常指的是 **Average Precision (AP)** 指标在信息检索会议 SIGIR (Special Interest Group on Information Retrieval)中的应用[^1]。平均精度(AP)是一种衡量信息检索系统性能的重要方法,尤其适用于返回结果列表的场景。 ### 平均精度(Average Precision, AP) 平均精度通过计算所有相关文档位置上的精确率(Precision)来反映系统的整体表现。具体而言,在每次遇到一个相关文档时,都会记录当前的精确率值,并最终取这些精确率值的加权平均作为 AP 的结果。 #### 计算公式 假设 \( R \) 是总的相关文档数,\( P(k) \) 表示第 \( k \) 个文档被检索到后的精确率,则 AP 可表示为: \[ AP = \frac{\sum_{k=1}^{n} P(k) \cdot rel(k)}{R} \] 其中: - \( n \): 总共检索出的文档数量; - \( P(k) \): 当前检索到第 \( k \) 个文档时的精确率; - \( rel(k) \): 如果该文档相关则为 1,否则为 0; - \( R \): 所有实际相关的文档总数。 此度量标准广泛应用于评价不同算法对于查询请求的有效性和准确性上。 ```python def compute_average_precision(retrieved_docs, relevant_docs): total_relevant = len(relevant_docs) correct_count = 0 precision_sum = 0 for i, doc in enumerate(retrieved_docs, start=1): if doc in relevant_docs: correct_count += 1 current_precision = correct_count / i precision_sum += current_precision ap_score = precision_sum / total_relevant if total_relevant != 0 else 0 return ap_score ``` 上述代码展示了如何基于给定的一组已获取文档 `retrieved_docs` 和一组真正相关的文档集合 `relevant_docs` 来实现 Average Precision 的简单计算逻辑。 ### Mean Average Precision (MAP) 进一步扩展,当需要对比多个查询的表现时,可以采用 MAP(Mean Average Precision),即对每一个查询分别求得其 AP 值后再做平均处理。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值