DAY5 Recommended system cold startup problem

推荐系统的冷启动问题

  • 推荐系统冷启动概念

    • ⽤户冷启动:如何为新⽤户做个性化推荐
    • 物品冷启动:如何将新物品推荐给⽤户(协同过滤)
    • 系统冷启动:⽤户冷启动+物品冷启动
    • 本质是推荐系统依赖历史数据,没有历史数据⽆法预测⽤户偏好
  • 用户冷启动

    • 1.收集⽤户特征

      • ⽤户注册信息:性别、年龄、地域

      • 设备信息:定位、⼿机型号、app列表

      • 社交信息、推⼴素材、安装来源

在这里插入图片描述

  • 2 引导用户填写兴趣
    在这里插入图片描述

  • 3 使用其它站点的行为数据, 例如腾讯视频&QQ音乐 今日头条&抖音

  • 4 新老用户推荐策略的差异

    • 新⽤户在冷启动阶段更倾向于热门排⾏榜,⽼⽤户会更加需要长尾推荐
    • Explore Exploit⼒度
    • 使⽤单独的特征和模型预估
  • 举例 性别与电视剧的关系
    在这里插入图片描述
    尽可能收集用户信息,构建用户画像
    根据用户的标签可以做人群聚类 用以有用户的行为做推荐
    更多的使用流行度对剑

  • 物品冷启动

    • 给物品打标签
    • 利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户。
      在这里插入图片描述
      物品打标签,构建物品画像
      基于内容的推荐
  • 系统冷启动

    • 基于内容的推荐 系统早期
    • 基于内容的推荐逐渐过渡到协同过滤
    • 基于内容的推荐和协同过滤的推荐结果都计算出来 加权求和得到最终推荐结果

如果应用缺少用户行动数据-》基于内容的推荐
随着用户行为积累的越来越多-》协同过滤
基于内容和协同过滤共同工作

基于内容的推荐

  • 给物品打标签(NLP)
    系统自己提取 从业务数据库中提取
    用户填写
    中文分词 利用算法计算词的权重(TF-IDF/Textrank)
  • 利用标签的文字 转化词向量
    word2vec
    词向量表示语义,认为这两个词的语义相近
  • 利用词向量 构建物品的向量
    一个物品有N个关键词,每个关键词对应一个词向量
    Σ 权重*词向量 / N 加权平均
    利用N个关键词的词向量获取物品向量
  • 通过物品向量计算相似度
    皮尔逊相关系统 计算物品向量的相似度

基于内容的推荐 基于物品的协同过滤 区别

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值