推荐系统Recommendation System:综述

http://blog.youkuaiyun.com/pipisorry/article/details/36633451

博客内容:

(个性化)推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐

非个性化推荐[推荐系统:非个性化推荐Non-personalized recommendation ]

推荐系统的评估方法

推荐系统综述

综述overview

人与物(large catalog of items)的交互的两大方式

搜索和推荐


需要推荐系统的原因

货架上的items很少,而网上商店的items是相当丰富的。

但是推荐随之而来的是长尾效应Long Tail phenomenon:


cutoff point左侧是流行的商品,右侧是不流行的,也称作长尾。长尾下面的面积一般比左侧还大,有太多的items没有被用户发现,这就需要推荐系统帮助人们寻找他们想要的items(注意这里的items也可能是facebook上的人物)。

[关于长尾效应的一个营销故事 The Long Tail : How Into Thin Air made Touching the Void a bestseller]

推荐系统的发展


形式化模型Formal Models

                                                                                                                                 Utility Matrix的一个示例:用户*电影->评分

    

utility function or a utility matrix looks at every pair of customer and item, and maps it to a rating

推荐系统要做的其实就是预测Utility Matrix中这些空白的地方的评分值会是多少,再去做相关推荐。

推荐系统三大关键问题

known数据收集;unknown数据推断;评估

数据收集Ratings

两种方式

现在一般都是两种方式的结合,使用隐性Ratings来补充显式Ratings。

推断评分Extrapolating Utilities

推荐系统两大关键问题及构建的三大方法

Unitily矩阵庞大而稀疏,冷启动问题

基于内容的推荐,协同过滤,隐语义模型

[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]

皮皮blog



推荐系统的评估Evaluating Recommender Systems

{这里主要针对协同过滤推荐的评估}

选择test data set(withheld ratings)

原始Unities矩阵

评估预测

均方根误差RMSE

rmse可能存在的问题:

误差测度问题Problem with Error Measures


1.预测多样性prediction diversity:预测的items都太相似,如对哈利波特评分高,推荐的都是哈利波特系列的电影,没有其它相关的电影。

2.预测环境prediction contexts:在法国旅游可能要推荐与法国有关的书籍,但是回国了再推荐就没有实际意义了。

3. 推荐的顺序:recommend items(movies or books) that are earlier in the sequence are ahead of items that are later in the sequence.

实际中,我们只关心高评分的预测(低评分预测根本不需要预测准确,因为低评分预测再准也没用,根本不会推荐预测分值低的),然而RMSE并没有对评分值高和低的items作区分,这样一来,实际中运行良好的推荐系统可能RMSE误差得分比较高。

所以选择另一种度量方法:

precision@k

precision@k:在测试集(testing data/ withheld ratings)中仅仅只看给定用户评分最高的top k个分数。

[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]

其它

[推荐系统偏差分析与改善What recommenders recommend: an analysis of recommendation biases and possible countermeasures]

[What is the Alternating Least Squares method in recommendation systems? - Quora]

皮皮blog



推荐系统注意事项

张栋:著名的关于推荐系统影响因素的“4-3-2-1”论断,“UI/UE(实指产品): 40%; Data: 30%; Domain knowledge: 20%; Algorithm: 10%”,激发了几乎整个领域的大讨论。

[推荐系统的坑]

[推荐系统的坑(2)]

from: http://blog.youkuaiyun.com/pipisorry/article/details/36633451

ref:


评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值