关于推荐系统中召回模块建模采样方式的讨论

CNU小学生

于 2020-03-19 17:16:28 发布

阅读量1.9k

点赞数 6

分类专栏：召回文章标签：推荐系统算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u011233351/article/details/104951598

版权

关于信息流推荐系统中召回模块建模采样方式的讨论

大家好，我是CNU小学生，国内top10-20互联网公司小兵一枚，在此抛砖引玉，真诚希望各位读者不吝赐教。

1.信息流推荐系统中的召回业务

2019年知名互联网公司的信息流推荐系统项目可大致分为4个模块：用户画像，物品画像，召回，排序。

召回模块的功能是在为排序模块提供候选集。比如我们一共有1000万个item，召回业务要在1000万个item中选出用户可能感兴趣的1万个项目，然后排序模块经过自己的模型为item打分，选定top n来展示给用户并确定展示的顺序。

召回模块的特点有两点，第一快速，第二全面。如果现在有一个超准确超高效的排序模型可以瞬间对每个item精准打分，那么我们完全不需要召回模块，可惜算力不够，这个真没有。推荐流程在3000ms内没有给出推荐结果，对于绝绝绝大多数产品而言是不可接受的。这就决定了一个在线召回模型不会是一个比排序还复杂的模型。此外离线召回也要考虑耗时，因为信息流场景需要一定实时性。

场景1.美女图片类新闻

早上8点为用户展示美女图片类新闻效果比晚上8点差很多。因为早上8点用户在公交车上，晚上8点用户躺在沙发上。排序模型必须把“当前时间”这个维度考虑进去，进行特征工程，才能达到预期效果。

类似于场景1现象还有很多，有些是我们能理解的，有些是我们不能理解的，这类问题需要通过复杂的模型（含特征工程）才能给出用户满意的结果，解决这类问题是排序模型的价值体现。召回则要剔除细节因素，全面广泛且高效快速地选拔出用户可能喜欢的东西，把相对耗时的细节处理任务交给排序。

最低0.47元/天解锁文章

博客等级

码龄12年

3
原创

181
点赞

279
收藏

65
粉丝

关注

私信

热门文章

分类专栏

最新评论

一文看懂HNSW算法理论的来龙去脉
xieshimao: 写得真不错
一文看懂HNSW算法理论的来龙去脉
John_Snowww: 写得太详细了
一文看懂HNSW算法理论的来龙去脉
howard_shooter: 这些“跳表”或者layer1、layer2，其实，是不是相当于在layer0中选出一些点，按照nsw算法把它们直接连起来？其实就相当于在layer0增加了几条高速公路？还是说先在layer2找，找到最终的最邻近m个向量后（c稳定了），再以这m个向量为基础，到下一层找，如此类推，直到最下一层。我觉得，关于查找时，如何在layer之间切换的过程，没说明白
一文看懂HNSW算法理论的来龙去脉
Tensor…Flow: floor取整了呀，肯定是层数
一文看懂HNSW算法理论的来龙去脉
袖口味道: 插入过程之前会先进行查找，所以优化查找过程就是在优化插入过程

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。