35、电影推荐与内存控制:Elasticsearch 实战解析

电影推荐与内存控制:Elasticsearch 实战解析

1. 电影数据与推荐策略

1.1 数据概述

在电影数据集中, mlmovies 中的每个文档代表一部电影,关键数据为电影的 _id 和标题, offset bytes 可忽略。该数据集包含 10,681 部电影。而 mlratings 则记录了用户的电影推荐信息,每个文档代表一个用户, user 字段为用户 ID, movie 字段列出了该用户观看并推荐的电影列表。

1.2 基于流行度的推荐

我们以《塔拉迪加之夜:瑞奇鲍比的民谣》( Talladega Nights: The Ballad of Ricky Bobby )为例,尝试基于流行度进行电影推荐。具体步骤如下:
1. 查找电影 ID

GET mlmovies/_search
{
  "query": {
    "match": {
      "title": "Talladega Nights"
    }
  }
}

通过上述查询,可知《塔拉迪加之夜》的 ID 为 46970。
2. 筛选并聚合推荐

GET
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值