在当今数字化时代,推荐系统已成为众多在线平台的核心组件,深刻影响着用户体验和业务效益。随着人工智能技术的迅猛发展,大模型的出现为推荐系统带来了前所未有的变革机遇。2024 年 10 月底,EARL 工作坊组织召开了第18届 ACM 推荐系统会议,此次研讨会由百度参与支持,作为展示推荐系统这一广泛领域的新研究成果、系统和技术的顶级国际论坛,会议汇集了来自学术界和工业界的研究人员和从业人员,讨论在一系列创新应用环境中提供推荐组件的新趋势和挑战。今天,笔者将就这次大牛云集的研讨会展开探讨,分析当下的大模型能力是如何构建推荐系统的最新范式的。
一、数据缺失难题的破局
推荐系统的精准性依赖于海量数据,但数据缺失一直是个棘手的问题。传统的数据填补方法往往难以捕捉数据中的复杂关系,导致推荐效果不尽人意。大模型,尤其是深度学习领域的预训练大模型,凭借其强大的表示学习能力和泛化能力,在处理复杂数据关系上展现出了前所未有的潜力。这些模型通过在大规模、多样化的数据集上进行预训练,能够学习到数据之间的深层次、非线性关系,这对于弥补数据缺失带来的信息损失至关重要。
在推荐系统中,大模型可以通过以下几种方式有效应对数据缺失问题:
1.特征嵌入与自监督学习:大模型能够学习用户和物品的高维特征嵌入,这些嵌入向量能够捕捉到用户和物品之间的潜在联系,即使某些直接交互数据缺失,也能通过相似特征的用户或物品进行信息补全。同时,利用自监督学习技术,模型可以从无标签的数据中学习有用的表示,进一步丰富数据的内在信息,提高推荐的准确性。
2.图神经网络(GNN)的应用:将用户-物品交互视为图结构中的边,用户和物品作为节点,大模型结合图神经网络可以高效地在这种复杂网络结构中传播信息。即使某些节点(用户或物品)的直接连接信息缺失,GNN 也能通过其他路径间接传递信息,填补数据空白,提升推荐系统的鲁棒性(指系统在面对不确定性和干扰时,仍然能够维持其功能和性能的能力)。
3.多任务学习与迁移学习:大模型支持多任务学习框架,可以同时优化多个相关任务,如评分预测、点击率预测等,通过共享底层表示来增强模型对数据的理解能力。此外,迁移学习允许模型将从源域(如其他相关数据集)学到的知识迁移到目标域(当前推荐系统),即使目标域数据稀疏,也能利用外部知识提升性能。
4.生成模型的应用:基于大模型的生成对抗网络(GANs)或变分自编码器(VAEs)等生成模型,可以生成高质量的伪数据来填补缺失值。这些模型能够学习