简介:和上一篇介绍的ICLR 2016文章所要解决的问题一致,即利用session内用户的点击序列去预测用户下一次点击的item。方法也运用的RNN,但是更多在于引入了一些优化方法,如data augmentation, model pretrain, generalized distillation ( use of privileged information) 等。
直接先上文中使用的模型图。相比上一篇文章,整个模型只有一处不同:
1. output Layer是直接预估newsid的embedding向量。
然而,文中在RNN基础上使用了多项优化技巧,这是本文的重点:
1) Data augmentation: 俗称数据变换,通过人工的方式从现有样本中制造出新的样本。文中使用了两种策略:(1) 对于给定的一条原始点击序列,将所有可能的前缀序列均做为一条新的训练样本。比如针对现有原始序列 x1,x2,x3...,xn ,生成 (x1,V(x2)) ,