多兴趣召回（Multi-Interest Recall）原理介绍

最新推荐文章于 2024-12-18 10:20:22 发布

goTsHgo

最新推荐文章于 2024-12-18 10:20:22 发布

阅读量1.1k

点赞数 28

分类专栏：深度学习人工智能文章标签：人工智能算法机器学习

本文链接：https://blog.youkuaiyun.com/goTsHgo/article/details/144453134

版权

28 篇文章

订阅专栏

6 篇文章

订阅专栏

多兴趣召回（Multi-Interest Recall）是一种处理用户多样化兴趣的推荐技术，广泛应用于复杂推荐场景（如电商、社交平台等）。相比传统方法仅提取单一兴趣特征，多兴趣召回能更细粒度地刻画用户兴趣，提升召回的丰富性与匹配度。

以下从底层原理和每一步背后的逻辑出发，完整详细地解释多兴趣召回的核心机制。

推荐系统的目标：
- 根据用户历史行为或上下文信息，预测用户可能感兴趣的物品。
- 包括两步：召回（从全量物品中筛选候选集）和排序（对候选集按相关性排序）。
单兴趣模型的局限：
- 传统方法用一个固定维度的向量（单兴趣）来表示用户，比如通过用户历史行为取平均值。
- 问题：用户兴趣往往是多样化的，使用单一向量难以准确反映不同兴趣点。
  - 示例：一个用户可能同时喜欢“电子产品”和“家居用品”，单一向量会模糊这种多样性。
多兴趣召回的优势：
- 对用户行为序列进行细粒度建模，生成多个兴趣向量。
- 每个兴趣向量捕获用户的某一类兴趣，从而召回与该兴趣匹配的物品。

多兴趣召回分为三大步骤：

以下分别详细说明每一步的核心机制和原理。

用户行为序列是多兴趣召回的输入，例如用户点击、浏览、购买的历史记录。这些行为序列反映了用户的潜在兴趣。

Embedding（嵌入层）：
- 将离散的物品 ID（如商品编号）映射到一个固定维度的嵌入空间。
- 嵌入层的权重矩阵是可学习参数，训练过程中通过反向传播不断优化。
- 直观理解：将每个商品“翻译”为一个向量，向量的语义反映商品之间的相似性。

假设：

通过查表操作，将商品 ID vivi 映射为嵌入向量：

$Embedding(v_i) = E[i, : ]$

这是多兴趣召回的核心部分，通过分析用户的行为序列，提取多个兴趣点（每个兴趣点对应一个向量）。

序列建模：
- 使用循环神经网络（如 GRU/LSTM）或自注意力机制（Transformer）对用户行为序列进行编码。
- 这些方法能够捕捉序列中时间顺序、上下文等信息。
动态路由机制：
- 动态路由是从序列中提取多个兴趣向量的一种方法。
- 核心思想是：
  1. 初始化多个兴趣中心（随机向量）。
  2. 用户的行为通过注意力权重分配到不同兴趣中心。
  3. 反复迭代，调整兴趣中心，使其更准确地表示用户不同兴趣点。