http://blog.youkuaiyun.com/pipisorry/article/details/36633451
博客内容:
(个性化)推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐
非个性化推荐[推荐系统:非个性化推荐Non-personalized recommendation ]
推荐系统的评估方法
推荐系统综述
综述overview
人与物(large catalog of items)的交互的两大方式
搜索和推荐
需要推荐系统的原因
货架上的items很少,而网上商店的items是相当丰富的。
但是推荐随之而来的是长尾效应Long Tail phenomenon:
cutoff point左侧是流行的商品,右侧是不流行的,也称作长尾。长尾下面的面积一般比左侧还大,有太多的items没有被用户发现,这就需要推荐系统帮助人们寻找他们想要的items(注意这里的items也可能是facebook上的人物)。
[关于长尾效应的一个营销故事 The Long Tail : How Into Thin Air made Touching the Void a bestseller]
推荐系统的发展
形式化模型Formal Models
utility function or a utility matrix looks at every pair of customer and item, and maps it to a rating
推荐系统要做的其实就是预测Utility Matrix中这些空白的地方的评分值会是多少,再去做相关推荐。
推荐系统三大关键问题
known数据收集;unknown数据推断;评估
数据收集Ratings
两种方式
现在一般都是两种方式的结合,使用隐性Ratings来补充显式Ratings。
推断评分Extrapolating Utilities
推荐系统两大关键问题及构建的三大方法
Unitily矩阵庞大而稀疏,冷启动问题
基于内容的推荐,协同过滤,隐语义模型
[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]
推荐系统的评估Evaluating Recommender Systems
{这里主要针对协同过滤推荐的评估}
选择test data set(withheld ratings)
原始Unities矩阵
评估预测
均方根误差RMSE
rmse可能存在的问题:
误差测度问题Problem with Error Measures
1.预测多样性prediction diversity:预测的items都太相似,如对哈利波特评分高,推荐的都是哈利波特系列的电影,没有其它相关的电影。
2.预测环境prediction contexts:在法国旅游可能要推荐与法国有关的书籍,但是回国了再推荐就没有实际意义了。
3. 推荐的顺序:recommend items(movies or books) that are earlier in the sequence are ahead of items that are later in the sequence.
实际中,我们只关心高评分的预测(低评分预测根本不需要预测准确,因为低评分预测再准也没用,根本不会推荐预测分值低的),然而RMSE并没有对评分值高和低的items作区分,这样一来,实际中运行良好的推荐系统可能RMSE误差得分比较高。
所以选择另一种度量方法:
precision@k
precision@k:在测试集(testing data/ withheld ratings)中仅仅只看给定用户评分最高的top k个分数。
[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]
其它
[推荐系统偏差分析与改善What recommenders recommend: an analysis of recommendation biases and possible countermeasures]
[What is the Alternating Least Squares method in recommendation systems? - Quora]
推荐系统注意事项
张栋:著名的关于推荐系统影响因素的“4-3-2-1”论断,“UI/UE(实指产品): 40%; Data: 30%; Domain knowledge: 20%; Algorithm: 10%”,激发了几乎整个领域的大讨论。
[推荐系统的坑]
from: http://blog.youkuaiyun.com/pipisorry/article/details/36633451
ref:
2073

被折叠的 条评论
为什么被折叠?



