- Query graphs:
Baeza-Yates 指出有5种不同类型的图。在所有的方法中,结点是query;边被引入两个结点间。
word graph:两个query有共同的term
session graph:同一个session内的query。
url conver graph:用户点击了搜索结果中的相同的url。
url link graph:两个被点击的url直接有边
link graph:如果两个url有共同的term。
2 Query Segmentation.
这里的query分割,不是对query的分词,而是对用户联系输入多个query,按照意图分割为多个session。
3.基本概念:
Query log:一个query log,必须包含的,user id(cookie),time,query,click url,browser,refer url
Session:特定用户在具体时间限制内的Query
构建THE QUERY-FLOW GRAPH(查询流图)
根据Query-Query的转义概率统计得到 query flow graph。由于某些query之间无法统计,因此另外一种方法是构造模型来计算query pair之间的相关性。模型特征包括3种特征:文本特征,session特征,时间相关的特征。
计算方法:
变为TSP问题求解。