一:推荐系统的目的:
要发掘长尾提高销售额,就必须充分研究用户的兴趣,而这正是个性化推荐主要解决的问题。推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们感兴趣但是又很难发现的商品
二:推荐系统的应用:
个性化推荐系统需要依赖用户的行为数据,总体来说,几乎所有的推荐系统应用都是由前台的展示页面,后台的日志系统以及推荐算法三部分构成。
亚马逊:
- 推荐结果的标题,缩略图,以及其它属性:告诉用户给他们推荐的是什么。
- 推荐结果的平均分:反应了推荐结果的质量
- 推荐理由:添加用户自选按钮,可以关闭推荐
- 个性化推荐:添加哪个好友喜欢的物品
2.1 个性化应用背景:
- 存在信息过载,因为如果用户可以很容易地从所有物品中找到喜欢的物品,就不需要个性化推荐了
- 用户大部分时候没有特别明确的的需求,因为如果用户有明确的需求,可以直接通过搜索引擎找到感兴趣的商品。
2.2 个性化应用形式:
- 电商平台
- 电影视频网站
- 社交网络
- 个性化阅读
- 基于位置的服务
2.3推荐系统评测:
好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但却不那么容易发现的东西。同时,推荐系统还要能够帮助商家将那些被埋没在长尾中的好商品介绍给他们感兴趣的商户。
2.4推荐系统实验方法:
一般来说,一个推荐算法最终上线,需要完成上面所说的三个实验。
1. 需要通过离线实验证明它在很多离线指标上优于现有的算法
2. 需要通过用户调查确定它的用户满意度不低于现有的算法
3. 通过在线的AB测试确定它在我们关心的指标上优于现有的算法
评测指标:
2.4.1:用户满意度:
用户满意度没有办法离线计算,只能通过用户调查或者在线实验获得。
在在线系统中,我们可以利用购买率
度量用户的满意度。此外,有些网站会通过设计一些用户反馈界面收集用户满意度。
更一般的情况下,我们通过统计反馈消息
以及点击率
,用户停留时间
,转化率
来度量用户满意度。
a、评分预测:用户给物品打分的功能,那么,如果知道了用户对物品的历史评分,就可以从学习的用户的兴趣模型,并预测该用户在将来看到一个他没有评过分的物品时,会给这个物品评多少分。
b、topN推荐:网站在提供推荐服务是,一般是给用户一个个性化的推荐列表,这种推荐叫做 TopN推荐。TopN推荐的预测准确率一般通过准确率(precision)
/召回率(recall)
度量
2.4.2 覆盖率:
覆盖率
描述了一个推荐系统对物品长尾的发掘能力,覆盖率
有不同的定义方法。一个好的推荐系统不仅需要有比较高的用户满意度,也要有比较高的覆盖率。
我们可以通过研究物品在推荐列表中出现的次数的分布描述推荐系统挖掘长尾
的能力,如果这个分布比较平,那么说明推荐系统的覆盖率较高,而如果这个分布比较陡峭,说明推荐系统覆盖率较低。我们有两个比较好的指标来定义覆盖率
1.信息熵
2.基尼系数
2.4.3 多样性
为了满足用户广泛的兴趣,推荐列表需要能够覆盖用户不同的兴趣领域,即推荐结果需要具有多样性,尽管用户的兴趣
2.4.4 新颖性
新颖的推荐是指给用户推荐那些他们以前没有听说过的物品,在一个网站中实现新颖性的最简单方法是,把那些用户之前在网站中对其有过行为的物品从推荐列表中过滤掉
2.4.5 惊喜度
令用户惊喜的推荐结果是和用户历史喜欢的物品不相似,但用户却觉得满意的推荐。
2.4.6 信任度
1、让用户了解推荐系统的推荐机制,让用户认同推荐系统的运行机制
2、利用好友信息给用户做推荐,并且用好友进行推荐解释。
2.4.7 实时性
1、推荐系统需要实时地更新推荐列表来满足用户新的行为变化
2、需要将新加入系统的物品推荐给用户
2.4.8 健壮性
1、设计推荐系统时尽量使用代价比较高的用户行为。比如,如果用户有购买行为和浏览行为,那么主要应该使用用户的购买行为,因为购买需要消费,所以攻击购买行为的代价远远大于浏览行为
2、在使用数据前,进行攻击检测,从而对数据进行清理