在推荐系统中,排序阶段分为粗排和精排,二者原理相似,粗排旨在快速筛选,减轻精排计算负担。本部分聚焦多目标排序模型,深入剖析其关键内容。
- 排序依据与多目标模型基础:推荐系统排序主要依据用户对物品的兴趣,通过用户与物品的交互数据计算消费指标来衡量,如点击率、点赞率、收藏率和转发率等。多目标排序模型以此为基础,输入用户、物品、统计和场景等多种特征,输出对多个指标的预估值。
- 多目标排序模型结构与训练
- 模型架构:多目标排序模型(MTL)输入多种特征,输出多个目标预估值。它通过神经网络进行特征处理,利用全连接层和 Sigmoid 函数得到点击率、点赞率等指标的预估值。
- 训练策略:采用交叉熵损失函数,将多个任务的交叉熵损失相加作为总损失函数,通过梯度下降更新模型参数。然而,训练面临类别不平衡问题,负样本远多于正样本,通常采取负样本降采样策略解决,但这又会导致新问题。
- 预估值校准的必要性与方法:负样本降采样后,点击率会被高估,且多目标模型需要统一量纲,在广告系统中,精确的 CTR 对于计费至关重要,因此需要进行预估值校准。通过推导真实点击率和预估点击率的关系,得出校准公式,校准后的点击率可作为排序依据。
- MMoE 模型解析
- 模型原理与结构:MMoE 是一种多目标排序模型,通过多个独立的 expert 塔提取特征,利用门控网络对多塔输出向量加权平均后送入多头。expert 网络数量和门控网络数量根据任务确定,门控网络由神经网络和 softmax 激活函数组成,输出概率值作为 expert 网络输出向量的权重。
- 极化问题及解决:训练 MMoE 时,softmax 易出现极化现象,导致部分 expert 网络未被有效利用,模型退化为简单多目标模型。为解决此问题,训练时对 so
推荐系统多目标排序模型核心要点

最低0.47元/天 解锁文章
541

被折叠的 条评论
为什么被折叠?



