MT-BICN:用于推荐的多任务平衡信息级联网络
1. 引言
随着电子商务的蓬勃发展,信息过载逐渐成为一个普遍存在的问题,这给在线购物平台的用户获取心仪商品带来了障碍。推荐系统为解决这一问题提供了有效方案,它通过挖掘用户的隐藏模式,为用户匹配一系列符合其需求的商品,大大减轻了信息过载的负面影响。
推荐系统通常需要同时优化多个目标,以满足不同的业务需求。例如,平台会同时预测点击率(CTR),以评估商品对用户的吸引力;预测浏览后点击转化率(CTCVR)和点击后转化率(CVR),以衡量商品或策略的实际经济效益;还会分析用户对商品的评分,以了解用户的复购意愿,并指导商家改进策略。
由于逐个构建这些任务的模型效率极低,因此多任务学习(MTL)在推荐系统的研究和应用领域都得到了广泛应用。MTL是一种机器学习范式,它通过同时训练不同任务的数据来获取共享表示。其中,硬参数共享机制是MTL最常用的建模方法之一,它通常为所有任务设置一个共享的底层特征提取器,并为每个任务保留几个特定的输出层。然而,任务之间的有害参数干扰会显著影响硬参数共享模型的性能,而且该机制无法有效捕捉任务之间的差异和更复杂的依赖关系。
为了应对这些挑战,近年来研究人员进行了许多有效的尝试,以建模任务之间的关系。主要有以下几种策略:
- 混合专家底层模式(Mixture - Experts - Bottom pattern) :在底层设置多个专家以捕捉更丰富的共享特征,并利用特定任务的门控网络聚合多个专家的输出,将其输入到顶层的特定任务塔中,从而自适应地建模任务之间的关系和差异。但这种模式只能在任务之间传递浅层表示。
- 概率转移模式(
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



