《The query-flow graph: model and applications》

本文深入探讨了Baeza-Yates提出的五种查询图类型及其在信息检索领域的应用,并阐述了如何通过构建查询流图来分析用户行为。重点介绍了通过统计查询转移概率构建查询流图的方法,以及利用文本、会话和时间相关特征来计算查询对之间的相关性。此外,文章还讨论了将查询问题转化为旅行商问题(TSP)进行求解的策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. Query graphs:

Baeza-Yates 指出有5种不同类型的图。在所有的方法中,结点是query;边被引入两个结点间。

word graph:两个query有共同的term

session graph:同一个session内的query。

url conver graph:用户点击了搜索结果中的相同的url。

url link graph:两个被点击的url直接有边

link graph:如果两个url有共同的term。


         2 Query Segmentation.

                    这里的query分割,不是对query的分词,而是对用户联系输入多个query,按照意图分割为多个session。

         3.基本概念:

Query log:一个query log,必须包含的,user id(cookie),time,query,click url,browser,refer url

Session:特定用户在具体时间限制内的Query

构建THE QUERY-FLOW GRAPH(查询流图)

根据Query-Query的转义概率统计得到 query flow graph。由于某些query之间无法统计,因此另外一种方法是构造模型来计算query pair之间的相关性。模型特征包括3种特征:文本特征,session特征,时间相关的特征。

计算方法:

变为TSP问题求解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值