《推荐系统实践》学习笔记(一)

本文介绍了推荐系统的背景和发展,包括信息过载问题、长尾理论等,并详细探讨了社会化推荐、基于内容的推荐及协同过滤推荐等技术。此外,还列举了Amazon、Netflix等平台的应用案例,以及推荐系统的评估指标和实验方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一章 好的推荐系统
1.信息过载:分类目录--搜索引擎--推荐系统
2.长尾理论:80/20原则
3.社会化推荐(social recommendation)好友给自己推荐物品
   基于内容的推荐(content-based filtering)和以前物品相似的物品
   基于协同过滤的推荐(collabrative filtering)和自己历史兴趣相似的用户的物品
4.依赖用户的行为数据。从实现的角度讲,就是挖掘用户的行为,找到用户个性化的需求。系统一般分为:前台的展示页面,后台的日志系统,以及推荐算法系统。
5.个性化的成功推荐需要两个条件,1. 信息过载 2,用户的需求不够明确。
7.什么样的物品适合推荐:消费代价小,用户热情高,种类丰富,重用率高,反馈容易。
8.个性化推荐系统的应用
  • Amazon
             个性化推荐列表1:基于物品的推荐算法(item-based method):推荐和之前喜欢的物品相似的
             个性化推荐列表2:基于好友的推荐:根据Facebook好友关系,推荐好友喜欢的物品
             相关推荐列表1:购买了也买了    打包销售(cross selling)
             相关推荐列表2:浏览了购买了
  • Netflix,YouTube,Hulu
              基于物品的推荐算法
  • Pandora:专家标注(音乐的基因)相似度
              Last.fm :利用用户行为计算相似度
  • Facebook
              宝贵的数据;用户之间的社交网络关系,用户的偏好信息
              API(Instant Personalization)推荐好友最喜欢的物品
              EdgeRank:推荐其他用户在社交网站的会话
              给用户推荐好友
  • Google Reader:感兴趣的人的分享
              Zite:用户的偏好信息
  • 个性化广告--物品就是广告,帮助广告找到可能感兴趣的用户
9.推荐系统的指标:预测准确度,同时扩展用户的视野。准确度,覆盖度,新颖性,惊喜度,信任度,透明度。
10.实验方法:离线实验,用户调查,在线实验(AB测试)。
11.评测指标:
      用户满意度(显式的用户反馈),
      预测准确度(评分预测(均方根误差RMSE,平均绝对误差MAE),
      topN推荐(准确率和召回率,会看曲线和趋势),
      覆盖率(覆盖长尾的能力,通过物品在推荐列表出现的次数的分布来描述长尾能力:信息熵和基尼指数),
      多样性(用推荐物品的相似性差异性来评价多样性),
      新颖性,(用户没听说)
      惊喜度(推荐了和历史不相似但用户满意的物品),
      信任度(增加透明度,给出解释,建立用户之间的信任系统), 
      实时性,
      强健性(行为注入攻击), 
     商业目标,),
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值