【第六章：项目实战之推荐/广告系统】1.推荐系统基础与召回算法-(4)召回用来干什么？“从茫茫人海中找到你“-优快云博客

第六章：项目实战之推荐/广告系统

在推荐系统中，我们常常面对两个核心问题：

类比：你就像茫茫人海中的一粒沙子，而推荐系统的召回阶段，就是试图在海量内容中找到适合你的那一部分。

召回（Recall / Candidate Generation）是推荐系统的第一步任务，其目标是：

通常，召回生成的候选集大约几百到几千条内容，然后再进入排序阶段进一步精细排序。

一句话总结：召回就是“先筛一大堆可能的，再慢慢挑最合适的”。

在推荐系统中直接做精细排序是不现实的，因为：

因此，召回阶段先把候选集缩小，然后排序模型再从这些候选中挑出最优的几个进行推荐。

举例：
假设一个电商平台有 1 亿件商品，如果直接给每个用户做打分，计算量非常大。召回阶段先筛选出 5000 个可能感兴趣的商品，再交给排序模型，效率就提升了 20000 倍左右。

召回方法通常有三类：

方法类别	核心思想	特点
基于内容(Content-based)	根据用户历史行为或偏好，找相似的内容	易解释，冷启动问题明显
协同过滤(Collaborative Filtering)	根据用户-物品交互矩阵找相似用户或相似物品	精准度高，但数据稀疏时效果差
深度学习 / 向量召回(Vector-based)	将用户和内容映射到向量空间，通过向量相似度快速召回	可扩展性强，支持海量数据，效果好