论文解析:Deep Reinforcement Learning for Page-wise Recommendations

本文解析了在RecSys 2019发表的论文,介绍京东如何运用深度强化学习解决页面级推荐问题。针对电商页面商品二维排列的特点,文章提出Actor-Critic框架,其中Actor采用encoder-decoder结构结合CNN和GRU,Critic则通过相同的结构生成状态表示进行Q值估计。实验显示,该方法在Precision@20等评价指标上表现出优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文解析:Deep Reinforcement Learning for Page-wise Recommendations

简介

京东在强化学习推荐系统方面的工作,发表在RecSys 2019. 本文与京东几乎同时的另一篇工作Deep Reinforcement Learning for List-wise Recommendations在整体架构上非常相似

背景

除了现有的推荐系统无法建模系统与用户的交互外(该问题由强化学习算法解决),本文还主要解决了电商推荐系统中推荐item在页面上二维排列的问题。具体来说,大家可以打开自己的京东APP或者打开京东网页版(淘宝也一样),可以看到商品都是一个个矩形密铺在界面上,而不像传统的信息检索问题中搜索结果是一条一条从上到下顺序排列(例如百度)。现有的ranking算法来源于信息检索领域,适用于顺序排列的页面,对于电商网站这样的密铺页面不是一种最好的建模方式。
下面是电商推荐和信息检索页面的对比,用于展示二维页面和一维页面的区别:
京东
京东电商二维页面

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值