阿里推荐模型
DIN、DIEN、MMOE、ESMM
多任务学习——MMOE
MMOE是MOE的改进,相对于MOE的结构中所有任务共享一个门控网络,MMOE的结构优化为每个任务都单独使用一个门控网络。
Shared Bottom 网络位于底层,多个任务共用这一层。往上,K个子任务分别对应一个tower network。任务相关性越高,模型的loss可以降低到更低;不相关任务学习效果不佳(这种Hard parameter sharing)。
为了解决这个问题,Google提出了Soft parameter sharing,MOE:
MOE由一组专家系统(Experts)组成的神经网络结构替换原来的Shared-Bottom部分,每一个Expert都是一个前馈神经网络,再加上一个门控网络(Gate)。MOE可以看成多个独立模型的集成方法。
多任务学习——ESMM
ESMM(Entire Space Multi-Task Model)是一个多任务学习模型,根据点击转化和点击的样本来学习pCTCVR和pCTR两个目标,把 pCVR 当做一个中间变量,同时输出预估的pCTR、pCVR 和pCTCVR。
cvr是指点击到购买的转化,但是存在两个问题:样本选择偏差和稀疏数据。
- 样本选择偏差:模型训练时只使用用户点击的样本,但是预测却是用的整个样本空间。
- 数据稀疏问题:用户点击到购买的样本太少。
为了解决这个问题:ESMM提出了转化公式:
就可以可分别估计 pctcvr(即p(y=1,z=1|x))和pctr(即p(y=1|x)),然后通过两者相除来解决。而pctcvr和pctr都可以在全样本空间进行训练和预估。但是这种除法在实际使用中会引入新的问题。因为pctr其实是一个很小的值,预估时会出现pctcvr>pctr的情况,导致pcvr预估值大于1。ESSM采用乘法的形式将pCTCVR和pCTR一起训练解决上述问题。
训练时,loss为两者相加。模型的Loss为:
注意力机制:人类天生的“选择性注意”的习惯
注意力模型——DIN
经典的Embedding MLP的框架,在用户历史行为部分应用了注意力机制。
DIN(Deep Interest Network)应用注意力机制的过程,根据历史行为商品和广告商品的Embedding,使用了激活单元来预测注意力权重。激活单元结构是通过把这两个输入 Embedding,与它们的外积结果连接起来形成一个向量,再输入给激活单元的 MLP 层,最终会生成一个注意力权重。
序列模型——DIEN
经典的Embedding MLP的框架,加上三层序列模型结构,模拟用户购买兴趣进化过程。
DIEN(Deep Interest Evolution Network)三层序列模型结构:基于Embedding层的行为序列层、基于GRU序列模型的兴趣抽取层、基于AUGRU序列模型的兴趣进化层。
- 行为序列层(Behavior Layer),把原始的 ID 类行为序列转换成 Embedding 行为序列;
- 兴趣抽取层(Interest Extractor Layer),利用 GRU 组成的序列模型,来模拟用户兴趣迁移过程,抽取出每个商品节点对应的用户兴趣。
- 利用 AUGRU(GRU with Attention Update Gate) 组成的序列模型,在兴趣抽取层基础上加入注意力机制,模拟与当前目标广告(Target Ad)相关的兴趣进化过程,兴趣进化层的最后一个状态的输出就是用户当前的兴趣向量。
多目标学习在推荐系统中的应用本文概览:1. 多目标学习提出的背景一般来说在搜索和推荐等信息检索场景下,最基础的一个目标就是用户的 CTRhttps://mp.weixin.qq.com/s?__biz=MzU2ODA0NTUyOQ==&mid=2247491211&idx=2&sn=a11007131f97835d655a4d451920843e&chksm=fc92a43dcbe52d2be58ef7e120d4bbff9ecdd8ffd5f9ebb473a97105c1fa71faadee1b403cf4&scene=126&sessionid=1605064054&key=059149d48d5c3e99fee7200bda4a5e4a7d0f1ab172f270b4a31ee39d0129a2210098dda57b4c275f69eb6ec5d674f4871ffcaef7636fa83bab1fb263f6c9673f88de8b4437ab0ab108b5e757060dc795c0031452e18002915f2f0c738c1f483eece0212fe66ba4aec07cd7b7fba4df7e812592e373fdc1c34e1bbf86d0acc1e1&ascene=1&uin=Mjg1NTU5MTQxMA%3D%3D&devicetype=Windows+10+x64&version=6300002f&lang=zh_CN&exportkey=A77db8rvlMC6aDR5FrUFMBM%3D&pass_ticket=8hNub%2BFu4yLIlzlFzkmkkQMUkX4moojyuksiXcSdcWti8q5%2BiG2QZTCpgM1wGGdz&wx_header=0多目标学习在推荐系统的应用(MMOE/ESMM/PLE) - 知乎一、前言最近搞了一个月的视频多目标优化,同时优化点击率和衍生率(ysl, 点击后进入第二个页面后续的点击次数),线上AB实验取得了不错的效果,总结一下优化的过程,更多的偏向实践。 二、业界方案2.1 样本Loss加权…
https://zhuanlan.zhihu.com/p/291406172