推荐系统包含哪些环节?
推荐系统有哪些召回路径?
- 2代表边,i、u、tag代表节点;
- i2i-从一个物品到另一个物品;
Netflix经典推荐系统架构
推荐系统技术架构
怎样实现基于内容的推荐系统?
地位:最早被使用的推荐算法,年代久远,但当今仍然被广泛使用,效果良好
定义:给用户x推荐之前喜欢的物品相似的物品。即U2I2I、U2Tag2I
怎样实现用户向量和物品向量的相似度计算?
优缺点
优点:
- 不需要其他用户的数据
- 能给具备独特口味的用户推荐
- 可以推荐最新的、冷门的物品
- 容易做推荐结果的解释
缺点:
- 很难找到能表达物品的“标签”,有时候需要人工打标签
- 过于局限于自己的世界,无法挖掘出用户的潜在兴趣
- 新用户如果没有行为,没法做推荐
怎样实现系统过滤的推荐系统?
推荐系统的分类
协同过滤Collaborative Filtering
使用用户行为数据,利用集体智慧推荐
实例:基于用户的协同过滤
推荐系统怎样实现多路召回融合排序?
问题:多路召回怎样融合排序?
几种多路召回结果融合排序
CTR(点击率)
推荐系统怎么实现AB实验?
为什么需要AB Test?
怎么实现AB测试?
AB测试中的常见错误
推荐系统怎样实现内容相似推荐
用户聚类推荐
聚类分析(Cluster analysis)亦称为群集分析,是一种数据点分组的机器学习技术。给定一组数据点,可以用聚类算法将每个数据点分到特定的组中。
推荐思路:将用户进行聚类,给每个聚类推荐该人群喜欢的内容。
聚类技术实现流程
用户聚类推荐的优缺点
推荐系统怎样实现矩阵分解协同过滤?
推荐系统的分类
矩阵分解
矩阵分解:指将一个矩阵分解成两个或者多个矩阵的乘积,意义层面的解释为通过隐性特征(latent factor)将user兴趣与item特征联系起来
矩阵分解-真实数据流动
矩阵分解的优缺点
推荐系统API服务接口长什么样子?
推荐系统的两大场景
API接口要完成的任务
整个推荐系统只有一个大接口,通过HTTP+JSON的方式对外提供服务
API接口设计
推荐系统怎么解决物品冷启动问题?
物品冷启动:新加入系统的物品,因缺少行为数据而无法被扩散推荐
在注重时效性的场景是问题,比如新闻类应用
解决物品冷启动的问题
方法1:基于物品相似算法的U2I2I,类似功能:看了还看、相关推荐
方法2:抖音内容推荐算法,多级流量池机制,实际上是基于行为方法的试探
当今推荐系统极其重要的Embedding技术
Embedding:近几年推荐技术研究的前沿、重要的、大量论文攻克的一个技术方向,并且在真实应用中收获了非常好的效果
- Embedding是什么东西?
- Embedding有什么用途?
- 怎样使用数据生成Embedding?
- 使用Embedding有什么技术难题?
Embedding 是什么东西?
怎么使用Embedding?
怎样使用数据生成Embedding?
1、基于内容的word2vec的Embedding
上图就是Item2vec算法的实现过程
2、协同过滤矩阵分解的方法
3、DNN深度学习的方法