学习效果
- 能通过推荐搜索的系统设计面试
- 能参加推荐比赛
学习资料
- 王树森
- torch-rechub
- kdd23
- sparraw
- 论文+blog
系统
离线层:不用实时数据,不提供实时响应;
近线层:使用实时数据,不保证实时响应;
在线层:使用实时数据,保证实时在线服务;
召回
- 多通道
- 双塔
- I2I
- 过滤
- 负样本
排序
-
多目标
-
特征:特征工程,特征交叉,序列特征
-
在线学习
-
粗排、精排
重排
- 多样性
- fresh
冷启动
- 全链路
- 流量调控
Bias
- position bias
线上线下不一致
AB test
数据
特征
召回
- content-based filtering: Uses similarity between items to recommend items similar to what the user likes.
- Content-based filtering doesn’t look at other users.
- collaborative filtering:Uses similarities between queries and items simultaneously to provide recommendations.
排序
重排
评测
部署
服务
维护
监测
Reference
- 工业界的推荐系统之概要 - 养生的控制人的文章 - 知乎
- https://datawhalechina.github.io/fun-rec/#/ch01/ch1.3
- fun-rec 代码
- https://www.tecton.ai/blog/guide-to-building-online-recommendation-system/
其他
学习路线
- ML design为base 然后读paper 读blog 之后自己在draw flow,反复几遍
- 方法的pros和cons,具体coding背后怎么算的,loss function优缺点,怎么优化
比赛
- KDD Cup 2023
给定session的历史交互序列,预测下一个交互item
- kaggle H&M
给定购买记录,预测topk