1.【FNN】《Deep Learning over Multi-field Categorical Data: A Case Study on User Response Prediction》
作者: Weinan Zhang and Tianming Du and Jun Wang
发布时间: 2016-01
来源: arXiv:1601.02376
引用数: 367
地址: https://arxiv.org/abs/1601.02376
笔记: 本文提出使用FMs(因式分解机制)、RBMs(受限制玻尔兹曼机)、DAEs(降噪自动编码)进行特征转换,然后利用深度神经网络模型学习多类别特征交互信息,从而进行用户广告点击预测。本文介绍了两种模型:Factorisation Machine supported Neu- ral Network (FNN) 和Sampling-based Neural Network (SNN)。
FNN:如图所示,FNN的底层是FM,从上到下分别是输出层:y^=sigmoid(W3l2+b3)\hat y=sigmoid(W_3l_2+b_3)y^=sigmoid(W3l2+b3)其中y^∈(0,1)\hat y \in (0,1)y^∈(0,1),l2l_2l2是隐藏层的输出:l2=tanh(W2l1+b2)l_2=tanh(W_2l_1+b_2)l2=tanh(W2l1+b2)隐藏层l1l_1l1和l2l_2l2是一样的,它的输入zzz是图中Dense Real Layer的输出:z=(w0,z1,z2,...,zn)z=(w_0,z_1,z_2,...,z_n)z=(w0,z1,z2,...,zn)其中nnn表示类别field的数量,w0w_0w0是全局的标量参数,ziz_izi是第iii个类别field参数向量,是通过FM计算得到:zi=W0i⋅x[starti:endi]=(wi,vi1,vi2,...,viK,)z_i=W^i_0·x[start_i:end_i]=(w_i,v_i^1,v_i^2,...,v_i^K,)zi=W0i⋅x[starti:endi]=(wi,vi1,vi2,...,viK,)其中starti、endistart_i、end_istarti、endi是第iii个类别field中的特征开始和结束索引,W0iW_0^iW0i是通过FM训练得到的参数。
SNN:SNN和FNN不同的一点是底层由FM换成全连接网络:z=sigmoid(W0x+b0)z=sigmoid(W_0x+b_0)z=sigmoid(W0x+b0),如下图。
2.【PNN】《Product-based Neural Networks for User Response Prediction》
作者: Yanru Qu and Han Cai and Kan Ren and Weinan Zhang and Yong Yu and Ying Wen and Jun Wang
发布时间: 2016-11
来源: arXiv:1611.00144
引用数: 375
地址: https://arxiv.org/abs/1611.00144
**笔记:**PNN和FNN也大同小异,如下图。同样的,从上到下分别是输出层:y^=σ(W3l2+b3)\hat y=\sigma(W_3l_2+b_3)y^=σ(W3l2+b3)l2l_2l2是隐藏层的输出:l2=relu(W2l1+b2)l_2=relu(W_2l_1+b_2)l2=relu(W2l1+b2)这里的隐藏层使用的是ReLU激活函数,而模型的底层使用的是张量的内积:A⊙B≜∑i,jAi,jBi,jA\odot B\triangleq \sum_{i,j}A_{i,j}B_{i,j}A⊙B≜i,j∑Ai,jBi,jlz和lpl_z和l_plz和lp的计算分别是:lz=(lz1,lz2,...,lzD1),lzn=Wzn⊙zl_z=(l_z^1,l_z^2,...,l_z^{D_1}),l_z^n=W_z^n\odot \mathbf{z}lz=(lz1,lz2,...,lzD1),lzn=Wzn⊙zlp=(lp1,lp2,...,lpD1),lpn=Wpn⊙pl_p=(l_p^1,l_p^2,...,l_p^{D_1}),l_p^n=W_p^n\odot \mathbf{p}lp=(lp1,lp2,...,lpD1),lpn=Wpn⊙p其中Wzn和WpnW_z^n和W_p^nWzn和Wpn是product layer中的权重。
3.【NCF】《Neural Collaborative Filtering》
作者: He, Xiangnan and Liao, Lizi and Zhang, Hanwang and Nie, Liqiang and Hu, Xia and Chua, Tat-Seng
发布时间: 2017-04
来源: International World Wide Web Conferences Steering Committee Proceedings of the 26th International Conference on World Wide Web
引用数: 1648
地址: https://doi.org/10.1145/3038912.3052569
笔记: 本文利用深度神经网络解决推荐系统中的协同过滤问题。通过深度神经网络替代张量内积,从数据中学习模型,提出使用多层感知机学习user-item交互信息。如下NCF架构图,输入层由用户uuu和item iii的特征向量vuU和viI\mathbf{v}_u^U和\mathbf{v}_i^IvuU和viI构成,输入层的上一层是全连接层,将稀疏的特征向量映射成稠密的语义向量,再上一层则是NCF层,是一个多层神经网络。其输出是:y^ui=f(PTvuU,QTviI∣P,Q,Θf)\hat y_{ui}=f(P^T\mathbf{v}_u^U,Q^T\mathbf{v}_i^I|P,Q,\Theta_f)y^ui=f(PTvuU,QTviI∣P,Q,Θf)其中f(PTvuU,QTviI)=ϕout(ϕX(...ϕ2(ϕ1(PTvuU,QTviI))...))f(P^T\mathbf{v}_u^U,Q^T\mathbf{v}_i^I)=\phi_{out}(\phi_X(...\phi_2(\phi_1(P^T\mathbf{v}_u^U,Q^T\mathbf{v}_i^I))...))f(PTvuU,QTviI)=ϕout(ϕX(...ϕ2(ϕ1(PTvuU,QTviI))...)),ϕ\phiϕ表示各层的映射函数。NCF的目标函数:L=−∑(u,i∈Y∪Y−)yuilogy^ui+(1−yui)log(1−y^ui)L=-\sum_{(u,i\in \mathcal{Y}\cup \mathcal{Y^-})}y_{ui}log\hat{y}_{ui}+(1-y_{ui})log(1-\hat y_{ui})L=−(u,i∈Y∪Y−)∑yuilogy^ui+(1−yui)log(1−y^ui)
4.【DRN】《DRN: A deep reinforcement learning framework for news recommendation》
作者: Zheng, Guanjie and Zhang, Fuzheng and Zheng, Zihan and Xiang, Yang and Yuan, Nicholas Jing and Xie, Xing and Li, Zhenhui
发布时间: 2018-04
来源: Proceedings of the 2018 World Wide Web Conference
引用数: 376
地址: https://doi.org/10.1145/3178876.3185994
笔记: 本文研究之前的方法存在一些问题:1、仅仅根据当前的反馈(如点击率)进行建模;2、很少使用用户的反馈信息;3、现有方法都趋向于推荐相似的news给用户。文本提出使用基于DQN的强化学习框架进行新闻推荐,考虑了用户活跃度来提高推荐精确度。如下图为模型框架,网络训练通过离线方式利用user-news点击日志数据进行训练,线上推荐部分则如下:
PUSH:每个时间戳(t1,t2,t3,t4,t5,...t_1,t_2,t_3,t_4,t_5,...t1,t2,t3,t4,t5,...)中根据请求用户的特征和候选新闻生成一个top-K的新闻推荐列表,推荐列表的生成是通过当前模型的挖掘和novel item的探索生成的。
FEEDBACK:根据接收到推荐列表的用户的点击行为生成反馈信息
MINOR UPDATE:每个时间戳t1t_1t1,模型会根据用户、新闻列表、反馈的信息特征去比较推荐性能,并判断是否需要更新模型。
MAJOR UPDATE:一段时间之后(如t3t_3t3),模型会利用用户的反馈信息和存储的用户活跃行为信息更新网络。
整个推荐系统将不断重复上述过程。
5.【List-Wise】《Deep Reinforcement Learning for List-wise Recommendations》
作者: Xiangyu Zhao and L. Zhang and Zhuoye Ding and Dawei Yin and Yihong Eric Zhao and Jiliang Tang
发布时间: 2017-12
来源: arXiv:1801.00209
引用数: 103
地址: https://arxiv.org/abs/1801.00209
笔记:

本文介绍了深度学习在推荐系统中的应用,包括FNN、PNN和NCF模型。FNN利用FM和深度神经网络学习多类别特征交互;PNN通过张量内积改进模型;NCF用多层感知机解决协同过滤问题;DRN采用深度强化学习框架优化新闻推荐;List-Wise则研究了列表级别的推荐策略。这些方法提升了推荐系统的精度和用户体验。






2302

被折叠的 条评论
为什么被折叠?



