推荐系统召回粗排的优化思路

原创

于 2025-08-06 20:19:52 发布 · 318 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#推荐算法 #深度学习 #算法

召回

召回作为推荐庞大候选底池中捞取候选的入口，一个完整的推荐系统都是由多路召回组成，甚至一些大场景的召回路数几十上百路，每一路召回最终曝光的独占比非常低。从召回迭代初期来看，一般新增合理的召回通路都能带来新线上指标的提升。但随着召回通路不断增加，一是线上召回的机器资源压力激增，二是受边际递减的规律，新增召回的收益会越来越小，最终导致新增召回的 ROI（投入产出比）非常低。
因此，召回的迭代路线主要包括新增合理的召回通路，在已有的召回通路上优化迭代，在多路召回每路的权重。

新增合理的召回通路
召回通路上优化迭代：一般来说倒排类的召回一般构建好后就不再需要长期迭代，相当于“一锤子买卖”，上线就把这一路的收益拿完了；召回的优化迭代主要在向量化召回上，向量化召回可以像排序模型一样长期迭代，也是一个轻量级的深度神经网络模型。向量化召回的迭代出要可以从样本，特征和结构三个大方向优化；
- 样本：增加更多场域的样本，跨域样本的利用，负样本的选取，样本采样与LogQ纠偏等
- 特征：属性特征，序列特征，Dense特征（多模态等）
- 结构：双塔结构，序列建模等
多路召回的权重设计：每路召回一般根据整个召回的Quota配额按照一定的比例权重分配，通过Snake Merge算法将多路召回的候选结果合并送往推荐的下一环节。权重参数一般可以通过手动搜参、设计自适应权重算法进行动态调整等。

粗排

粗排受限于打分数量的限制，需要比较高的性能要求，所以粗排模型的结构相对来说比较简单，是一种介于向量召回和精排之间的一种结构。一般粗排也是双塔结构，在底层的特征处理过程都是User侧和Item侧分离的过程，因为一次请求下粗排会计算上千个Item

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

JackHCC 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。