【每周一篇】常用推荐算法总结

本文总结了推荐系统的概念、评价标准及常用算法,包括热度排行、协同过滤(User-based和Item-based CF)、基于内容的推荐、混合方法等。深入探讨了协同过滤的优缺点、最近邻算法、矩阵分解以及限制玻尔兹曼机在推荐系统中的应用。同时,介绍了最新研究方向,如学习排序、情境推荐和深度学习在推荐中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文主要来源:阿里云天池技术圈常用推荐算法(50页干货)
部分进行总结和详细解释(原文属于比较精炼没有侧重点的提纲)
适合和我一样的推荐算法小白和入门者

主要内容

一.推荐系统简介

  • 信息过载
    从海量信息中过滤出用户需要的信息。
  • 信息过滤三种方法:
    1.类目导航(如:搜狗,用户按类目逐层查找)
    2.搜索(如:谷歌,用户提供意图明确的query)
    3.推荐(如:头条,系统主动给提供用户选择)
  • 推荐系统的发展史(略)
  • 推荐系统的应用和价值(略)
  • 推荐系统的评价标注(重要):
    1.用户满意度:调研、用户反馈,点击率、转化率等
    2.准确性:prediction/recall/F-score三个参数的具体解释
    3.覆盖率:照顾到尾部物品和用户
    4.多样性:两两之间不相似
    5.新颖性:没听过,没见过的物品
    6.惊喜性:。。?
    7.用户信任度/可解释性:推荐理由
    8.鲁棒性/健壮性:哈利波特现象1,抗攻击、反作弊
    9.实时性:新加入的物品;新的用户行为(实时意图)
    10.商业目标:一个用户带来的盈利
  • 推荐系统的核心问题:
    如何评价一个用户(user)对一个物品(item)的评分(喜欢程度)
    在这里插入图片描述
  • 影响推荐效果的因素
    1.用户交互界面(用户对推荐系统第一感知)
    2.数据
    数据收集:有效性(真实、准确)、全面性(是否有偏)
    数据处理:清洗、挖掘
    3.领域知识(产品定位、具体推荐需求的理解)
    4.算法迭代(锦上添花)
  • 推荐算法的两个阶段
    在这里插入图片描述

二.传统的推荐算法

  • 非个性化推荐:热度排行
  • 协同过滤:
    • Memory-based(aka neighborhood-based)方法:Item-based/user-based CF
    • Model-based方法:频繁项挖掘/聚类/分类/回归/矩阵分解/RBM/图模型
  • 基于内容/知识的推荐(Content-based/Knowledge-based)
  • 混合方法(Hybird Approaches)

热度排行

  • 不同的排行榜算法:
  • 评价
    • 容易实现
    • 更新慢,难以推新
    • 排行榜更多是业务问题而不是算法问题

协同过滤(Collaborative Filtering)

  • 思想来源(略)
    示例图
  • 基本组成元素:
    • N个用户,M个物品
    • 评分矩阵:用户对物品的评分(显式)或用户对物品的行为(隐式)
    • 相似性度量:物品与物品(人与人) 之间的相似性
Memory-based

将用户的所有数据读入内存中进行运算,所以被称为Memory-based

User-based CF

算法步骤

  • Step1 协同(在线)
    计算目标用户的(前k
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值