RS Meet DL(74)-[天猫]MIND：多兴趣向量召回

最新推荐文章于 2025-09-30 10:10:58 发布

原创

最新推荐文章于 2025-09-30 10:10:58 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了MIND（Multi-Interest Network with Dynamic Routing）算法，该算法用于解决推荐系统召回阶段的单一兴趣表示问题，特别是在天猫场景下。MIND通过生成多个用户兴趣向量，提升召回阶段效果，降低头部效应。文章详细阐述了MIND的Embedding Layer、Multi-Interest Extractor Layer、Label-aware Attention Layer的结构和工作原理，以及其在训练和服务阶段的实现。实验结果显示，MIND在线上和线下实验中都表现出良好的性能。

本文介绍的论文是：《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall》

关于召回阶段的算法，以youtube DNN为代表的向量化召回方式是目前的主流算法之一，但是目前的大多数算法仅仅将用户的兴趣表示成单个的Embedding，这是不足以表征用户多种多样的兴趣的，同时容易造成头部效应。因此本文提出了MIND，同时生成多个表征用户兴趣的Embedding，来提升召回阶段的效果，一起来学习一下。

1、背景

在天猫的推荐过程中，推荐系统也被拆分为召回和排序阶段。

本文重点关注召回阶段的算法。召回阶段的目标是得到数千个跟用户兴趣紧密相关的商品候选集。在天猫场景下，用户每天都要与成百上千的商品发生交互，用户的兴趣表现得多种多样。如下图所示，不同的用户之间兴趣不相同，同时同一个用户也会表现出多样的兴趣：

因此，对于用户兴趣的建模显得至关重要。目前召回阶段主流的算法是协同过滤和向量化召回。协同过滤面临稀疏性的问题。而向量化召回方法如youtube dnn，将用户的兴趣表示成一个固定长度的向量。

但在天猫场景下，对于用户多样化的兴趣，一个Embedding往往是不够的，除非这个Embedding的长度足够大，具有足够的表征能力。除此之外，只有一个Embedding会造成一定的头部效应，召回的结果往往是比较热门领域的商品（头部问题），对于较为小众领域的商品，召回能力不足。

解决上述问题的方法也很简单，搞多个用户Embedding就好了嘛，而本文要介绍的MIND，正是通过生成多个表征用户兴趣的Embedding，来提升召回阶段的效果，一起来学习一下。（昨天听了俊林老师的讲座，这个方向也是他比较看好的）

2、MIND

2.1 问题概述

召回阶段的目标是对于每个用户u∈

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。