Elasticsearch机器学习功能配置详解

包怡妹Alina

于 2025-06-01 09:00:13 发布

阅读量237

点赞数 3

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_01148/article/details/148359801

Elasticsearch内置了强大的机器学习功能，默认情况下是启用的。这些功能可以帮助用户进行异常检测、数据分析等高级操作。本文将详细介绍Elasticsearch中与机器学习相关的各项配置参数，帮助管理员和开发者更好地理解和使用这些功能。

需要注意的是，Elasticsearch的机器学习功能在x86_64架构的机器上需要CPU支持SSE4.2指令集。如果你的硬件比较老旧，不支持这个指令集，那么必须通过设置xpack.ml.enabled为false来禁用机器学习功能。这个限制不适用于aarch64架构的机器。

要让节点具备机器学习能力，需要在node.roles中包含ml角色。集群中至少需要一个机器学习节点才能运行机器学习任务。

重要提示：

xpack.ml.enabled参数控制是否启用机器学习API：

xpack.ml.max_machine_memory_percent：控制机器学习进程可以使用的机器内存百分比（默认30%）
- 这个限制是基于机器总内存，而非当前可用内存
- 取值范围5-200，但建议不要设置过高
xpack.ml.max_model_memory_limit：限制单个机器学习任务可以使用的最大内存
- 默认值为0，表示不限制
- 如果设置为特定值，创建任务时超过此限制会报错
xpack.ml.use_auto_machine_memory_percent：自动计算机器学习进程可用的内存百分比
- 启用后会忽略xpack.ml.max_machine_memory_percent设置
- 仅建议在专用机器学习节点上使用

xpack.ml.max_open_jobs：控制单个节点上可以同时运行的机器学习任务数量
- 包括异常检测任务和数据分析任务
- 默认512，范围1-512
xpack.ml.node_concurrent_job_allocations：控制每个节点上可以同时处于"opening"状态的任务数量
- 默认2