-------yahoo 真是大公无私,发表了n多的论文。
本论文只有两页。
首先是提取特征,包括编辑距离、符号重叠度。
类似hubble的关键词和点击页面的关系。
广告特征。
位置特征
然后用TED做分析。 基本上就是一个线性回归,求两个query之间的相关度。
使用误差分析的方法,使整体的误差最小。
看了论文,还没有办法用到实践上面。
本论文只有两页。
首先是提取特征,包括编辑距离、符号重叠度。
类似hubble的关键词和点击页面的关系。
广告特征。
位置特征
然后用TED做分析。 基本上就是一个线性回归,求两个query之间的相关度。
使用误差分析的方法,使整体的误差最小。
看了论文,还没有办法用到实践上面。