2024’阿里推出LLM-KERec：融合LLM和知识图谱提升电商推荐效率-优快云博客

一、Introduction

推荐系统（RS）的主要目标是通过分析用户的历史行为来推断用户偏好，并推荐最符合其兴趣的物品。为此，我们将推荐任务总结为以下子任务的组合：
1）基于用户的点击行为推荐感兴趣物品；
2）基于用户的购买行为推荐可能购买的物品；
3）进行业务干预以探索用户其他潜在的兴趣。

传统CTR预测模型已被广泛应用于解决这些子任务。尽管在RS中取得了显著的性能提升，但它们仍面临两大挑战：
1）高度依赖用户的浏览记录和用户反馈，限制了RS在冷启动场景中的性能；
2）用户交互数据的稀疏性导致推荐感兴趣比推荐新物品更有效。

因此，结合有效的知识和大语言模型（LLM）以提高推荐系统的性能成为了趋势。我们提出了一种新的LLM-KERec推荐系统，该系统结合了传统模型高效的协作信号处理能力和大语言模型，帮助用户迅速找到他们喜欢的物品。该方法不仅减少了传统模型推荐结果中的重复性，还提高了整体点击率和转化效果。

二、System Overview

1、Traditional Recommendation Module

在传统的推荐架构中，用户打开应用时，推荐系统根据用户请求信息触发召回模块（热门召回、LBS召回、个性化召回等），筛选出大量可能感兴趣的候选物品。随后，粗排模型生成一个较小的候选物品集合，进一步缩小选择范围。最终，精排和重排模型决定展示顺序。每一步可能需要人工干预，例如分配物品权重以优化推荐效果。

2、LLM-based Complementary Knowledge Enhancement

在本文中，LLM-KERec 系统保持了高效处理大量协作信号的能力，并通过基于LLM的互补知识增强模块克服了挑战。为了在支付宝中建立不同物品之间的联系，LLM-KERec 通过为用户的购买行为和所有物品创建一个统一的实体系统，将这些物品联系起来。利用世界知识和常识知识，我们使用一个大语言模型来确定实体间的互补关系，构建互补图，并训练实体-实体-物品（E-E-I）权重决策模型。通过这种方法，我们可以为用户最喜欢的物品和互补物品提供个性化推荐，该解决方案已在支付宝营销场景中成功实施。

三、Diving into the LLM-KERec

LLM-KERec 系统中的模块功能如图所示：

在这里插入图片描述

1、Entity Extractor

Entity Dict

在实际应用中，例如支付宝，用户的操作覆盖多种场景。为了协调不同来源的信息，建立统一关联模式至关重要，这通过我们的实体词典实现，它包含数万个实体，并且每周都会更新。每个实体代表一个特定概念，如“电话”或“可乐”。

Extracting Entities

基于实体字典的方法，我们重点从支付宝用户行为中抽取实体（包括账单、访问日志及营销场景中的物品），这相当于命名实体识别（NER）任务。通过BERT-CRF模型，我们能准确抽取实体。在基于大语言模型的补充知识增强中，我们从用户最近的账单和物品信息中抽取实体，建立购买行为与推荐物品的联系，流程如图所示。

在这里插入图片描述

2、Complementary Graph Construction

我们利用实体提取器的结果构建一个互补图，这有助于我们了解用户的购买模式。具体而言，我们希望通过自然语言理解和常识推理来理解用户在购买物品 A（比如餐具）之后通常会购买哪些物品 B（比如纸巾）。

互补图的构建涉及两个主要步骤：

生成候选实体对，以提高效率并覆盖所有物品。
结合提示工程和大语言模型进行推理以提取有价值的见解。

Entity Pair Construction

首先，某些物品与特定概念之间存在互补关系，而这些概念通常涵盖了更多具体的物品。在工业电子商务场景中，尽管物品数量庞大，但概念类别相对有限。通过将概念作为实体，可以显著节省计算资源。在前面，我们已经使用实体提取器为所有物品分配了唯一的实体标识。

构建实体对的一种简单方法是：从包含个实体的集合中选取元素，并将它们成对组合，从而产生个候选实体对。然而，这种方法由于下游大语言模型的推理速度较慢而不经济。此外，实际场景中存在长尾分布，少数实体经常被购买，而大多数实体很少被消费。

为了解决这一挑战，我们设计了一种成本效益高的分段组合策略：

根据总转化率和点击率等指标将实体按降序排序，分为极度受欢迎、受欢迎和不受欢迎的实体。
专注于在受欢迎的实体之间构建实体对。
构建包括极度受欢迎和不受欢迎实体之间的实体对，确保对不受欢迎物品的互补图进行全面覆盖。

通过合并和消除所有实体对中的重复物品，我们获得最终输出。这种分段组合策略确保了对下游模块的可靠支持，同时最大限度地减少了资源浪费。

Large Language Model

我们利用Claude 2进行实体间互补关系的推理，具体方法是设计提示，涵盖输入格式、任务描述、示例及其理由和输出格式。最终答案表示为 Y 或 N，其中 Y 表示存在互补关系，N 表示不存在互补关系。此外，我们还探索了ChatGPT 3.5和ChatGLM 2。

Automatic Update Strategy

在真实的电子商务环境中，用户和商家彼此依赖并相互促进，实体的流行度是动态的。例如，商家通过营销策略吸引公众关注，而较老的产品会逐渐被取代。为此，我们实现了一个自动的每日调度来构建增量互补图，通过及时更新确保系统的有效和持续运行，这对于长期保持最佳性能至关重要。

3、E-E-I weight decision model

目前，我们已成功将每个用户的最近账单和物品链接到互补图中的实体。目标是基于用户的账单推荐互补物品，其中存在实体1-实体2的关系。然而，由于LLM在准确评估用户偏好的能力有限，我们需要一个E-E-I权重决策模型来完成此任务。

Model Overview

该模型的成功很大程度上依赖于高质量 E-E-I 重量决策模型的构建。我们提出了一种两阶段互补知识增强程序，包括排序阶段和集成阶段，如图所示。

Ranking Stage

如图所示，我们的模型采用双塔架构，其中双塔的输出分别代表互补物品和账单实体的表示。这些输出的点乘作为偏好水平指示器。对于物品的表示方法，可以从数据库中提取丰富的特征集。然而，对于实体的表示方法，我们面临一个挑战，因为我们除了一个预分配的ID外，缺乏具体描述它们的信息。为解决这一限制，我们采用图神经网络和对比学习从两个不同的视角来表示实体：一级可替代视图和二级互补视图。

排名阶段可以进一步细分为以下模块：

「图构建」

图神经网络（GNNs）在推荐系统中表现出色，因为它们可以有效地利用高阶关系。这些方法将交互数据表示为图，并通过迭代传播邻域信息来学习有效的节点表示。同样，如图所示，我们设计了以下边关系来更好地表示实体：