推荐算法面试

阿里推荐模型

 

DIN、DIEN、MMOE、ESMM

多任务学习——MMOE

MMOE是MOE的改进,相对于MOE的结构中所有任务共享一个门控网络,MMOE的结构优化为每个任务都单独使用一个门控网络。

Shared Bottom 网络位于底层,多个任务共用这一层。往上,K个子任务分别对应一个tower network。任务相关性越高,模型的loss可以降低到更低;不相关任务学习效果不佳(这种Hard parameter sharing)。

为了解决这个问题,Google提出了Soft parameter sharing,MOE:

MOE由一组专家系统(Experts)组成的神经网络结构替换原来的Shared-Bottom部分,每一个Expert都是一个前馈神经网络,再加上一个门控网络(Gate)。MOE可以看成多个独立模型的集成方法。

多任务学习——ESMM

ESMM(Entire Space Multi-Task Model)是一个多任务学习模型,根据点击转化和点击的样本来学习pCTCVR和pCTR两个目标,把 pCVR 当做一个中间变量,同时输出预估的pCTR、pCVR 和pCTCVR。

cvr是指点击到购买的转化,但是存在两个问题:样本选择偏差和稀疏数据

  1. 样本选择偏差:模型训练时只使用用户点击的样本,但是预测却是用的整个样本空间。
  2. 数据稀疏问题:用户点击到购买的样本太少。

为了解决这个问题:ESMM提出了转化公式:

就可以可分别估计 pctcvr(即p(y=1,z=1|x))和pctr(即p(y=1|x)),然后通过两者相除来解决。而pctcvr和pctr都可以在全样本空间进行训练和预估。但是这种除法在实际使用中会引入新的问题。因为pctr其实是一个很小的值,预估时会出现pctcvr>pctr的情况,导致pcvr预估值大于1ESSM采用乘法的形式将pCTCVR和pCTR一起训练解决上述问题。

训练时,loss为两者相加。模型的Loss为:

 


注意力机制:人类天生的“选择性注意”的习惯

注意力模型——DIN

经典的Embedding MLP的框架,在用户历史行为部分应用了注意力机制。

DIN(Deep Interest Network)应用注意力机制的过程,根据历史行为商品和广告商品的Embedding,使用了激活单元来预测注意力权重。激活单元结构是通过把这两个输入 Embedding,与它们的外积结果连接起来形成一个向量,再输入给激活单元的 MLP 层,最终会生成一个注意力权重。

序列模型——DIEN

经典的Embedding MLP的框架,加上三层序列模型结构,模拟用户购买兴趣进化过程。

DIEN(Deep Interest Evolution Network)三层序列模型结构:基于Embedding层的行为序列层、基于GRU序列模型的兴趣抽取层、基于AUGRU序列模型的兴趣进化层。

  1. 行为序列层(Behavior Layer),把原始的 ID 类行为序列转换成 Embedding 行为序列;
  2. 兴趣抽取层(Interest Extractor Layer),利用 GRU 组成的序列模型,来模拟用户兴趣迁移过程,抽取出每个商品节点对应的用户兴趣。
  3. 利用 AUGRU(GRU with Attention Update Gate) 组成的序列模型,在兴趣抽取层基础上加入注意力机制,模拟与当前目标广告(Target Ad)相关的兴趣进化过程,兴趣进化层的最后一个状态的输出就是用户当前的兴趣向量。


多目标学习在推荐系统中的应用本文概览:1. 多目标学习提出的背景一般来说在搜索和推荐等信息检索场景下,最基础的一个目标就是用户的 CTRhttps://mp.weixin.qq.com/s?__biz=MzU2ODA0NTUyOQ==&mid=2247491211&idx=2&sn=a11007131f97835d655a4d451920843e&chksm=fc92a43dcbe52d2be58ef7e120d4bbff9ecdd8ffd5f9ebb473a97105c1fa71faadee1b403cf4&scene=126&sessionid=1605064054&key=059149d48d5c3e99fee7200bda4a5e4a7d0f1ab172f270b4a31ee39d0129a2210098dda57b4c275f69eb6ec5d674f4871ffcaef7636fa83bab1fb263f6c9673f88de8b4437ab0ab108b5e757060dc795c0031452e18002915f2f0c738c1f483eece0212fe66ba4aec07cd7b7fba4df7e812592e373fdc1c34e1bbf86d0acc1e1&ascene=1&uin=Mjg1NTU5MTQxMA%3D%3D&devicetype=Windows+10+x64&version=6300002f&lang=zh_CN&exportkey=A77db8rvlMC6aDR5FrUFMBM%3D&pass_ticket=8hNub%2BFu4yLIlzlFzkmkkQMUkX4moojyuksiXcSdcWti8q5%2BiG2QZTCpgM1wGGdz&wx_header=0多目标学习在推荐系统的应用(MMOE/ESMM/PLE) - 知乎一、前言最近搞了一个月的视频多目标优化,同时优化点击率和衍生率(ysl, 点击后进入第二个页面后续的点击次数),线上AB实验取得了不错的效果,总结一下优化的过程,更多的偏向实践。 二、业界方案2.1 样本Loss加权…https://zhuanlan.zhihu.com/p/291406172

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值