【序列推荐】RecSys2020|SSE-PT---个性化的Transformer推荐模型

最新推荐文章于 2025-05-11 16:45:39 发布

Blank_spaces

最新推荐文章于 2025-05-11 16:45:39 发布

阅读量1.1k

点赞数

文章标签： python 机器学习人工智能深度学习 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Blank_spaces/article/details/110675933

版权

本文介绍了SSE-PT模型，一种在2020年RecSys会议上提出的个性化Transformer推荐模型，旨在解决序列推荐中的非个性化问题。模型结合Transformer架构和Stochastic Shared Embeddings正则化技术，能有效处理长序列并提高推荐精度。实验结果显示SSE-PT在多个方面优于SASRec。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

文章发表在2020年RecSys会议，提出了一个SSE-PT（随机共享Embedding的个性化Transformer）模型。论文将SASRec作为靶子，在各个方面（个性化、精度、收敛速度等）进行对比，展现了模型的优越性。并且，对于处理长序列时，提出了一种策略。本篇分享笔记是第二次阅读论文时写下的，很多地方提出了自己的思考与讨论。
本文约2.6k字，预计阅读10分钟。

概要

整篇论文指向了SASRec模型最大的一个问题：「非个性化」。这是作者的动机，因此提出了一个SSE-PT的个性化模型，模型主要是以Transformer模型作为主要的框架，加入了作者2019年自己提出的「Stochastic Shared Embeddings」正则化技术，组成了整个模型。其中，我认为本文还有两个关键的点是：

如何使模型具有个性化？
如何去处理长序列的情况？

文章在方法和实验中，证明了SSE-PT模型的有效性，以及个性化的体现。

模型

作者提出的SSE-PT模型受两部分内容启发：

Transformer模型；
一个新的正则化技术stochastic shared embeddings（SSE，随机分享embedding），与论文是同一作者；

接下来对于序列推荐的定义、SSE-PT模型结构、SSE和SSE-PT++进行解释与讨论。

序列推荐

对于个用户，每个用户都包含一个历史浏览物品子集。假设个用户的物品历史序列为：

其中序列包含用户的最近个历史物品。

序列推荐的目标是去学习一个对所有个物品中最重要的个物品的个性化排序。

SSE-PT结构

以下是整个模型的整体结构，如下所示：

Embedding Layer

首先定义用户、物品的Embedding映射矩阵，其中分别表示用户、物品的embedding维度。

其次定义一个「可学习」的位置编码（positional encoding）表，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。