协同过滤与推荐系统评估
1. 协同过滤的调整因素
在进行协同过滤时,仅仅实现算法往往不足以得到良好的推荐结果,通常有许多因素需要调整。以下是一些可调整的方面:
- 使用的评分 :
- 是否仅使用积极评分。
- 是否仅使用最新评分。
- 如何对评分进行归一化。
- 相似度创建 :
- 计算两部电影的相似度时需要多少用户对它们进行评分。
- 是否仅将正相似度添加到相似度列表中。
- 邻域创建 :
- 应使用何种方法选择邻域。
- 邻域的大小(选择阈值和/或N个相似度)。
- 评分预测 :
- 应使用分类还是回归。
- 是否使用加权平均。
- 推荐返回 :是返回所有推荐,还是仅返回预测良好(即预测值高于阈值)的推荐。
这些调整会影响计算过程中涉及的项目数量。例如,对用户重叠数量的要求会显著影响模型中的相似度数量。以MovieGEEKs网站为例,如果不要求最小重叠,大约有4000万相似度;若要求两个重叠,就会降至500万。
| 用户重叠要求 | 相似度数量 |
|---|---|
| 无最小重叠 | 约4000万 |
| 两个重叠 |
超级会员免费看
订阅专栏 解锁全文
1242

被折叠的 条评论
为什么被折叠?



