推荐系统:基于内容过滤与矩阵分解的探索
1. 基于内容的过滤推荐
1.1 预测与推荐展示
预测仅基于一部电影的评分进行。这种方式是否有益可自行判断,但它至少能提供一个排序,列出与用户高评分项目更相似的项目。
内容推荐在特定电影的详情页面展示,当前项目即为特色电影。而首页的个性化推荐,则需遍历用户的所有项目,基于其LDA向量计算相似度,排序后返回给用户。
1.2 基于内容的推荐器评估
评估基于内容的推荐器时,传统的数据交叉验证方法不适用于内容数据。可使用与评估MAP类似的代码,具体步骤如下:
1. 创建一个接受评分列表的推荐方法,使用用户评分的训练部分调用该方法。
2. 考虑如何划分每个用户的数据,可保证一定量的训练数据、一定数量的测试评分,或设定特定划分点。
3. 执行以下代码运行评估:
> python -m evaluator.evaluation_runner -cb
此代码会创建一个包含评估数据的CSV文件。
1.3 基于内容过滤的优缺点
基于内容的推荐器通过寻找相似内容来工作,评估结果取决于领域和用户特性,即用户是否倾向于同一类型内容,或用户的冒险程度。以下是基于内容过滤的优缺点:
- 优点 :
- 易于添加新项目,创建项目特征向量即可。
- 无需大量流量,根据内容描述找到相似度,首次访问或评分即可开始推荐。
- 推荐不受流行度影响,冷门电影与热门电
超级会员免费看
订阅专栏 解锁全文
1775

被折叠的 条评论
为什么被折叠?



