目录
第1章 好的推荐系统
1.1 什么是推荐系统
场景:小便利店,通过经验浏览货架,找到想买的东西
大型超市,通过分类信息,找到想买的东西
淘宝当当,通过搜索引擎,找到想买的东西
为解决信息过载,出现了各种解决方案:
(1)分类目录:比如雅虎。方便用户找到主要分类,但有限。
(2)搜索引擎:比如谷歌。前提:必须要用户明确需求。
(3)推荐系统:不需要用户有明确需求,只需要根据用户历史行为分析给出推荐。
推荐系统:用来联系用户和商品,为用户提供感兴趣的商品;为厂商的商品带来关注。
在用户没有明确需求的情况下,解决信息过载。
长尾理论:80/20,80%的销售额来自20%的热门商品。个性化推荐想去解决这个问题。
1.2 个性化推荐系统的应用
1.2.1 电子商务
亚马逊:提供2个推荐列表
(1)个性化商品推荐列表
基于物品的推荐算法:推荐和之前喜欢的物品相似的物品
基于facebook上好友喜欢的物品推荐
给出:推荐结果的标题/图/属性、平均分、推荐理由
(2)相关推荐列表
购买过这个商品的用户经常购买的其他商品
浏览过这个商品的用户经常购买的其他商品
1.2.2 电影和视频网站
Netflix,基于物品的推荐算法
1.2.3 个性化音乐网络电台
pandora:先进行内容标注,再进行基于内容的推荐
Last.fm:没有标注,利用用户行为计算歌曲的相似度。基于协同过滤。
1.2.4 社交网络
facebook:用户之间的社交网络关系、用户的偏好信息;基于此,推出推荐API,Instant Personalization即时定制
1.2.5 个性化阅读
Google Reader:关注感兴趣的人,看用户分享
Zite:收集用户对文章的反馈,不断更新用户的个性化文章列表
Digg:根据用户历史行为计算用户之间的相似度,给用户推荐和他相似的用户喜欢的文章
1.2.6 基于位置的服务
Foursquare:探索行为,给用户推荐好友在附近的行为
思考:为什么外卖网站不做一个:附近用户行为的推荐呢?
1.2.7 个性化邮件
将邮件按照历史行为和习惯对邮件重排序,优先处理重要邮件。
1.2.8 个性化广告
上下文广告、搜索广告、个性化展示广告
思考:咱们以后广告多了,是不是也要做广告的个性化推荐?
1.3 推荐系统评测
好的推荐系统应该是令用户、物品提供者、提供推荐系统的网站三方共赢。
好的推荐系统不仅仅是准确预测用户的行为,比如,明天太阳从东方升起,这种预测准确是毫无意义的。更应该去扩展用户视野,挖掘用户的潜在兴趣。
1.3.1 推荐系统实验方法
离线实验、用户调查、在线实验
1.3.2 评测指标
(1)用户满意度
(2)预测准确度
评分预测:RMSE均方根误差、MAE平均绝对误差
TopN推荐:召回率和准确率
(3)覆盖率:解决长尾效应
(4)多样性:解决长尾效应
(5)新颖性:推荐用户以前不知道的
(6)惊喜度:用户不知道,并且很满意
(7)信任度:增加透明度,比如解释推荐原因;社交背书,好友推荐。
(8)实时性
(9)健壮性:能够接受蓄意攻击
比如:购买商品A的用户也经常购买的其他商品。那么,注册多个用户,同时购买商品A和自己的商品。
如果算法在如此攻击前后,推荐基本保持不变,说明健壮性很好。
(10)商业目标
1.3.3 评测维度
评测是有一些维度的,不同维度下,同样的算法可能有不同的效果。
用户维度:人口统计学信息、活跃度、是否新用户
物品维度:物品属性、流行度、平均分、是否新物品
时间维度:季节、工作日节假日、白天晚上