LLM4Rec：推荐系统的协作大型语言模型

鲍珍博Quinn

于 2025-03-31 10:49:35 发布

阅读量763

点赞数 29

本文链接：https://blog.youkuaiyun.com/gitblog_00423/article/details/146804018

版权

LLM4Rec 是一个结合了基于 ID 的范式和基于 LLM（Large Language Model）的范式的推荐系统。该系统由弗吉尼亚大学 VAST LAB 和 LinkedIn 的研究人员共同开发，旨在充分利用两种范式的优势，为推荐系统提供更加精准和高效的推荐。

LLM4Rec 通过一种名为“相互正则化的预训练与软硬提示”的策略，实现了在异构用户/物品标记的推荐定向语料库上的语言建模。此外，项目还提出了一种面向推荐系统的微调策略，使得在不产生幻觉的情况下，能够有效地生成以整个物品空间为候选集的多个物品推荐。

LLM4Rec 的技术架构主要包括以下几个部分：

GPT4Rec Tokenizer 类：这个类通过引入用户/物品标记，将词汇分解为标记。如果原始词表的词汇量为 $N$，对于具有 $I$ 个用户和 $J$ 个物品的系统，用户 ID 和物品 ID 被视为原子标记，并在词汇表的基础上进行扩展。
GPT4Rec Base Model 类：这个基类扩展了原始 GPT2 的词汇表，加入了用户/物品 ID 标记。在训练过程中，原始词汇表和变压器权重被冻结，只有用户/物品 ID 嵌入可以更新。
Collaborative GPT 类：这个类定义了协作 GPT，用于在推荐系统中进行语言建模（即下一个标记预测）。它通过以“用户_i 与 ... 互动过”的形式提供提示，对互动过的物品序列进行语言建模。
Content GPT 类：这个类定义了内容 GPT，它对用户/物品内容进行语言建模。以亚马逊评论数据为例，它将“用户_i 为物品_j 编写以下评论”作为提示，对主要评论文本进行语言建模。