电影推荐与内存控制:Elasticsearch 实战解析
1. 电影数据与推荐策略
1.1 数据概述
在电影数据集中, mlmovies 中的每个文档代表一部电影,关键数据为电影的 _id 和标题, offset 和 bytes 可忽略。该数据集包含 10,681 部电影。而 mlratings 则记录了用户的电影推荐信息,每个文档代表一个用户, user 字段为用户 ID, movie 字段列出了该用户观看并推荐的电影列表。
1.2 基于流行度的推荐
我们以《塔拉迪加之夜:瑞奇鲍比的民谣》( Talladega Nights: The Ballad of Ricky Bobby )为例,尝试基于流行度进行电影推荐。具体步骤如下:
1. 查找电影 ID :
GET mlmovies/_search
{
"query": {
"match": {
"title": "Talladega Nights"
}
}
}
通过上述查询,可知《塔拉迪加之夜》的 ID 为 46970。
2. 筛选并聚合推荐 :
GET
超级会员免费看
订阅专栏 解锁全文
1718

被折叠的 条评论
为什么被折叠?



