Rech5 召回算法进阶

本文是对七月在线课程召回算法进阶的一个简单笔记记录。 本笔记主要围绕课上所讲常见召回方式、协同过滤、关联商品召回、基于图的Swing召回算法、Embedding召回(item2vec|node2vec)、YutubeDNN 、动态多兴趣挖掘模型MIND、多路召回融合。 

目录

常见召回方式

关联商品召回 

 Swing算法

基于Embedding召回

基于Youtue DNN 

 动态多兴趣挖掘模型MIND

多路召回融合 


常见召回方式

U2i

  • 基于矩阵分解、协同过滤的结果,直接给u推荐i;
  • 指从一个用户到达一个物品,user 到item

    • 一般指用户的直接行为,比如播放、点击、购买等;
    • 用户查看了一个物品,就会再次给它推荐这个物品
    • 结合i2i一起使用,就是用户查看以合物品,就会给他推荐另一个相似的物品,就是u2i2i路径;

i2i:

  • 计算item-item相似度,用于相似推荐、相关推荐、关联推荐。 另一种理解,从一个物品到达另外一个物品,item 到 item。
  • 应用:头条,在下方列出相似的、相关的文章;
  • 算法:

    • 内容相似,eg:文章的相似,取标题的关键字,内容相似
    • 协同过滤
    • 关联规则挖掘等。
    • 两个物品被同时看的可能性很大,当一个物品被查看,就给他推荐另一个物品

u2u2i

  • u2u2i:基于用户的协同过滤,先找相似用户,再推荐相似用户喜欢的item;从一个用户,到达另一个用户,到达一个物品
  • 先计算u2u:两种方法
    • 一是:取用户的性别、年龄、职业等人工属性的信息,计算相似性,得到u2u;
    • 一是:从行为数据中进行挖掘,比如看的内容和视频大部分很相似,就可以看作一类人;
    • 也可以使用聚类的方法进行u2u计算
    • u2u一般用在社交里,比如微博、Facebook,推荐感兴趣的人
  • userB和UserC相似,如果userB查看了某个商品,就把这个商品推荐给userC;

u2i2i

  • :基于物品的协同过滤,先统计用户喜爱的物品,再推荐他喜欢的物品;
  • 从一个用户,通过一个物品,到达另一个物品
    • 用户查看了一个耳机(u2i),找出和这个耳机相似或者相关的产品(i2i)并推荐给用户
    • 对路径的使用,已经从一条线变成两条线
    • 方法:就是把两种算法结合起来,先得到u2i的数据,再利用i2i的数据进行扩展,就可以从第一个节点,越过一个节点,到达第三个节点,实现推荐
    • 中间的桥梁是item

u2tag2i

  • u2tag2i:基于标签的泛化推荐,先统计用户偏好的tag向量,然后匹配所有的Item,这个tag一般是item的标签、分类、关键词等tag;

    中间节点是Tag标签,而不是 u 或者 i

    • 京东,豆瓣,物品的标签非常丰富、非常详细;比如统计一个用户历史查看过的书籍,就可以计算标签偏好的向量:标签+喜欢的强度。

    • 用户就达到了tag的节点,而商品本身带有标签,这就可以互通,进行推荐

    • 先算出用户的tag偏好,然后匹配item列表

    • 这种方法的泛化性能比较好(推荐的内容不那么狭窄,比如喜欢科幻,那么会推荐科幻的所有内容)

    • 今日头条就大量使用标签推荐

 基于U2I 和U2U2I的区别?

U2I通常是值对于一个用户而言,通过分析此用户本身过去的购买、收藏、点击过某个对象,当下次用户访问时,给其推荐之前有过相关行为记录的内容,具体分析可以通过基于矩阵分解、协同过滤的结果,直接给u推荐i;。 而基于用户的协同过滤,先找相似用户,再推荐相似用户喜欢的item;

用户向量和物品向量相似度计算

最基本的余弦相似度:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值