模型结构:
相关度计算:
query和doc语义向量的余弦距离:R(Q,D)=cos(yQ,yD)=yQTyD∣∣yQ∣∣yD∣∣R(Q,D)=\cos(y_Q,y_D) = \frac{y_Q^{\mathrm{T}}y_D}{||y_Q|| y_D||}R(Q,D)=cos(yQ,yD)=∣∣yQ∣∣yD∣∣yQTyD
损失函数:
softmax计算后验概率: P(D∣Q)=exp(γR(Q,D))∑di∈Dexp(γR(Q,D))P(D|Q) = \frac{exp(\gamma R(Q,D))}{\sum_{d_i \in D} exp(\gamma R(Q,D))}P(D∣Q)=∑di∈Dexp(γR(Q,D))exp(γR(Q,D))
L(Λ)=−log∏(Q,D+)P(D+∣Q)L(\Lambda) = - \text{log} \prod_{(Q,D^+)} P(D^+|Q)L(Λ)=−log(Q,D+)∏P(D+∣Q)
相似Query 推荐
通过用户的搜索Query和曝光点击商品的日志,使用双向LSTM网络把Query和商品title表征成语义向量。最后只使用Query的向量,计算Query距离最接近的Query。