推荐系统Recommendation System：综述

最新推荐文章于 2024-06-14 18:08:24 发布

原创最新推荐文章于 2024-06-14 18:08:24 发布 · 4.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#推荐系统 #推荐系统的评估方法 #推荐系统注意事项

推荐系统Resys 专栏收录该内容

13 篇文章

订阅专栏

http://blog.youkuaiyun.com/pipisorry/article/details/36633451

博客内容：

（个性化）推荐系统构建三大方法：基于内容的推荐content-based，协同过滤collaborative filtering，隐语义模型(LFM, latent factor model)推荐

非个性化推荐[推荐系统：非个性化推荐Non-personalized recommendation ]

推荐系统的评估方法

推荐系统综述

综述overview

人与物(large catalog of items)的交互的两大方式

搜索和推荐

需要推荐系统的原因

货架上的items很少，而网上商店的items是相当丰富的。

但是推荐随之而来的是长尾效应Long Tail phenomenon：

cutoff point左侧是流行的商品，右侧是不流行的，也称作长尾。长尾下面的面积一般比左侧还大，有太多的items没有被用户发现，这就需要推荐系统帮助人们寻找他们想要的items（注意这里的items也可能是facebook上的人物）。

[关于长尾效应的一个营销故事 The Long Tail : How Into Thin Air made Touching the Void a bestseller]

推荐系统的发展

形式化模型Formal Models

Utility Matrix的一个示例：用户*电影->评分

utility function or a utility matrix looks at every pair of customer and item, and maps it to a rating

推荐系统要做的其实就是预测Utility Matrix中这些空白的地方的评分值会是多少，再去做相关推荐。

推荐系统三大关键问题

known数据收集；unknown数据推断；评估

数据收集Ratings

两种方式

现在一般都是两种方式的结合，使用隐性Ratings来补充显式Ratings。

推断评分Extrapolating Utilities

推荐系统两大关键问题及构建的三大方法

Unitily矩阵庞大而稀疏，冷启动问题

基于内容的推荐，协同过滤，隐语义模型

[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]

推荐系统的评估Evaluating Recommender Systems

{这里主要针对协同过滤推荐的评估}

选择test data set(withheld ratings)

原始Unities矩阵

评估预测

均方根误差RMSE

rmse可能存在的问题：

误差测度问题Problem with Error Measures

1.预测多样性prediction diversity：预测的items都太相似，如对哈利波特评分高，推荐的都是哈利波特系列的电影，没有其它相关的电影。

2.预测环境prediction contexts：在法国旅游可能要推荐与法国有关的书籍，但是回国了再推荐就没有实际意义了。

3. 推荐的顺序：recommend items(movies or books) that are earlier in the sequence are ahead of items that are later in the sequence.

实际中，我们只关心高评分的预测（低评分预测根本不需要预测准确，因为低评分预测再准也没用，根本不会推荐预测分值低的），然而RMSE并没有对评分值高和低的items作区分，这样一来，实际中运行良好的推荐系统可能RMSE误差得分比较高。

所以选择另一种度量方法：

precision@k

precision@k：在测试集（testing data/ withheld ratings）中仅仅只看给定用户评分最高的top k个分数。

[海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses 推荐系统Recommendation System]

其它

[推荐系统偏差分析与改善What recommenders recommend: an analysis of recommendation biases and possible countermeasures]

[What is the Alternating Least Squares method in recommendation systems? - Quora]

推荐系统注意事项

张栋：著名的关于推荐系统影响因素的“4-3-2-1”论断，“UI/UE(实指产品): 40%; Data: 30%; Domain knowledge: 20%; Algorithm: 10%”，激发了几乎整个领域的大讨论。

[推荐系统的坑]

[推荐系统的坑(2)]

from: http://blog.youkuaiyun.com/pipisorry/article/details/36633451

ref:

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。