本文是对七月在线课程召回算法进阶的一个简单笔记记录。 本笔记主要围绕课上所讲常见召回方式、协同过滤、关联商品召回、基于图的Swing召回算法、Embedding召回(item2vec|node2vec)、YutubeDNN 、动态多兴趣挖掘模型MIND、多路召回融合。
目录
常见召回方式

U2i
- 基于矩阵分解、协同过滤的结果,直接给u推荐i;
-
指从一个用户到达一个物品,user 到item
- 一般指用户的直接行为,比如播放、点击、购买等;
- 用户查看了一个物品,就会再次给它推荐这个物品
- 结合i2i一起使用,就是用户查看以合物品,就会给他推荐另一个相似的物品,就是u2i2i路径;
i2i:
- 计算item-item相似度,用于相似推荐、相关推荐、关联推荐。 另一种理解,从一个物品到达另外一个物品,item 到 item。
- 应用:头条,在下方列出相似的、相关的文章;
-
算法:
- 内容相似,eg:文章的相似,取标题的关键字,内容相似
- 协同过滤
- 关联规则挖掘等。
- 两个物品被同时看的可能性很大,当一个物品被查看,就给他推荐另一个物品
u2u2i
- u2u2i:基于用户的协同过滤,先找相似用户,再推荐相似用户喜欢的item;从一个用户,到达另一个用户,到达一个物品
- 先计算u2u:两种方法
- 一是:取用户的性别、年龄、职业等人工属性的信息,计算相似性,得到u2u;
- 一是:从行为数据中进行挖掘,比如看的内容和视频大部分很相似,就可以看作一类人;
- 也可以使用聚类的方法进行u2u计算
- u2u一般用在社交里,比如微博、Facebook,推荐感兴趣的人
- userB和UserC相似,如果userB查看了某个商品,就把这个商品推荐给userC;
u2i2i
- :基于物品的协同过滤,先统计用户喜爱的物品,再推荐他喜欢的物品;
- 从一个用户,通过一个物品,到达另一个物品
- 用户查看了一个耳机(u2i),找出和这个耳机相似或者相关的产品(i2i)并推荐给用户
- 对路径的使用,已经从一条线变成两条线
- 方法:就是把两种算法结合起来,先得到u2i的数据,再利用i2i的数据进行扩展,就可以从第一个节点,越过一个节点,到达第三个节点,实现推荐
- 中间的桥梁是item
u2tag2i
- u2tag2i:基于标签的泛化推荐,先统计用户偏好的tag向量,然后匹配所有的Item,这个tag一般是item的标签、分类、关键词等tag;
中间节点是Tag标签,而不是 u 或者 i
-
京东,豆瓣,物品的标签非常丰富、非常详细;比如统计一个用户历史查看过的书籍,就可以计算标签偏好的向量:标签+喜欢的强度。
-
用户就达到了tag的节点,而商品本身带有标签,这就可以互通,进行推荐
-
先算出用户的tag偏好,然后匹配item列表
-
这种方法的泛化性能比较好(推荐的内容不那么狭窄,比如喜欢科幻,那么会推荐科幻的所有内容)
-
今日头条就大量使用标签推荐
-
基于U2I 和U2U2I的区别?
U2I通常是值对于一个用户而言,通过分析此用户本身过去的购买、收藏、点击过某个对象,当下次用户访问时,给其推荐之前有过相关行为记录的内容,具体分析可以通过基于矩阵分解、协同过滤的结果,直接给u推荐i;。 而基于用户的协同过滤,先找相似用户,再推荐相似用户喜欢的item;
用户向量和物品向量相似度计算
最基本的余弦相似度:

最低0.47元/天 解锁文章
2444

被折叠的 条评论
为什么被折叠?



