推荐系统中经常会遇到一个问题-特定用户的品味跟大众品味的相似程度(众口味程度),比如说要预测movielens(如下图所示)中用户给电影的打分情况(满分5颗星,也可以选择半颗星),我们就可以通过计算用户评分偏离平均评分1.5颗星所占比率(computed the proportion p of their ratings that deviated by 1.5 units from the movie’s average rating)去衡量用户的众口味程度。比率越靠近0说明这个用户的口味跟大众口味就越相似,越靠近1说明这个用户跟大众口味越不同。

p:众口味程度
假设我们定义:如果0 ≤ p < 0.3 的用户就是跟大众口味比较相似的用户,而0.3 ≤ p的用户就是跟大众口味不相似的用户。
实验结果如下图所示:在这里我们只需要关心红色那条曲线
可以发现MovieLens推荐系统对0 ≤ p < 0.3的用户的预测效果要优于0.3 ≤ p的用户。
上述实验表明:我们在设计推荐系统,应该考虑将用户分类进行预测,比如说可以根据用户的众口味程度进行聚类,然后在各个聚类上设计不同的个性化预测。
PS:详细说明可以看看这篇论文:Who predicts Better? – Results from an Online Study Comparing Humans and an Online Recommender System
本文探讨了在推荐系统中,特定用户的品味与大众品味的相似程度如何影响其预测效果,通过计算用户评分偏离平均评分1.5颗星的比例来衡量众口味程度,并展示了该程度如何影响预测质量。研究建议根据用户的众口味程度进行聚类预测,以提高个性化推荐的准确性。
2297

被折叠的 条评论
为什么被折叠?



