ElasticSearch集群搭建步骤

Asui2233

已于 2025-04-21 16:38:18 修改

阅读量1.4k

点赞数 27

分类专栏： Elasticsearch 文章标签： elasticsearch 大数据 linux

于 2024-02-28 16:15:50 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_44965990/article/details/136325731

版权

Elasticsearch 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了如何使用RPM包安装Elasticsearch，包括导入GPG密钥、设置基本安全性和加密HTTP客户端通信，以及配置集群参数，以便在多节点环境中搭建并管理Elasticsearch集群。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、前言

Elasticsearch 是一个开源的分布式搜索和分析引擎，用于全文搜索、结构化搜索、分析和可视化大规模数据。它被设计成一个可扩展的实时搜索引擎，能够处理大规模数据，并提供快速的搜索和分析功能。
以下是一些 Elasticsearch 的特性和用途：

全文搜索：Elasticsearch可以存储大量的数据，并提供基于全文搜索的查询功能，支持各种复杂的查询操作。
实时性：Elasticsearch能够实时索引数据，并且查询的响应时间非常快，适用于需要快速查询的场景。
分布式架构：Elasticsearch 是一个分布式系统，数据被分散存储在多个节点上，可以水平扩展以处理大规模数据。
多种数据类型支持：Elasticsearch 支持多种数据类型的索引和查询，包括文本、数字、日期等。
强大的查询语言：Elasticsearch 提供了丰富而灵活的查询语言，可以满足各种复杂的查询需求。
实时数据分析：除了搜索功能，Elasticsearch 还提供了强大的数据分析功能，可以对数据进行聚合、统计和可视化分析。
易于部署和管理：Elasticsearch 提供了简单易用的API和管理工具，可以方便地部署、监控和管理集群。
与其他工具集成：Elasticsearch 与许多工具和技术（如Logstash、Kibana、Beats等）集成，构建了强大的日志管理和数据分析解决方案。

总的来说，Elasticsearch是一个功能强大且灵活的搜索和分析引擎，适用于各种场景，包括日志分析、实时监控、全文搜索等。

本例将在3台机器上搭建 Elasticsearch 集群:

192.168.72.151  node-1
192.168.72.152  node-2
192.168.72.153  node-3

二、使用 RPM 安装 Elasticsearch

导入 Elasticsearch GPG 密钥

下载并安装公共签名密钥

rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

从 RPM 存储库安装

在 /etc/yum.repos.d/ 创建 elasticsearch.repo

[elasticsearch]
name=Elasticsearch repository for 8.x packages
baseurl=https://artifacts.elastic.co/packages/8.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=0
autorefresh=1
type=rpm-md

执行 yum install 命令

yum install --enablerepo=elasticsearch elasticsearch -y

默认生成的目录
安装目录：/usr/share/elasticsearch
配置文件目录：/etc/elasticsearch

启动 Elasticsearch 命令：

systemctl enable elasticsearch.service
systemctl start elasticsearch.service

三、设置基本安全性

首次启动 Elasticsearch 时，会为用户生成密码，并自动为用户配置 TLS ，可以随时调整 TLS 配置，更新节点证书

生成证书

1、在任意节点上进入 Elasticsearch 的安装目录，使用 elasticsearch-certutil 为集群生成 CA 。

bin/elasticsearch-certutil ca

设置 CA 文件名（默认即可）
为 CA 设置密码

2、利用上一步的 elastic-stack-ca.p12 为集群生成证书和私钥。

bin/elasticsearch-certutil cert --ca elastic-stack-ca.p12

输入CA的密码
为证书创建密码，并设置文件名（默认即可）

3、将证书拷贝到其他节点上。

使用TLS加密节点间通信

1、进入 Elasticsearch 配置目录，编辑 elasticsearch.conf 文件:

cluster.name: my-cluster
node.name: node-1
xpack.security.enabled: true
xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate 
xpack.security.transport.ssl.client_authentication: required
xpack.security.transport.ssl.keystore.path: elastic-certificates.p12
xpack.security.transport.ssl.truststore.path: elastic-certificates.p12

2、执行以下命令将证书密码保存到 Elasticsearch 的 keystore

bin/elasticsearch-keystore add xpack.security.transport.ssl.keystore.secure_password

bin/elasticsearch-keystore add xpack.security.transport.ssl.truststore.secure_password

3、为集群中的每个节点完成前面的步骤。
4、在集群的每个节点上，重新启动 Elasticsearch 。

四、为 Elasticsearch 加密 HTTP 客户端通信

1、在任意单个节点上，从安装 Elasticsearch 的目录中，运行Elasticsearch HTTP 证书工具生成证书签名请求(CSR)。

bin/elasticsearch-certutil http

是否生成 CSR ，输入 n 。
是否使用现有 CA ，输入 y 。
输入 CA 的路径。这是 elastic-stack-ca.p12 的绝对路径。
输入 CA 的密码。
输入证书的有效期。
是否为每个节点生成一个证书，输入 y 。
输入每个节点的名称（node.name）。
输入所有节点的主机名、IP地址。
输入私钥密码。

该命令生成一个 .zip 文件，其中包含 Elasticsearch 和 Kibana 使用的证书和密钥。每个文件夹都包含一个 README.txt ，说明如何使用这些文件。

2、解压缩生成的 elasticsearch-ssl-http.zip 文件。这个压缩文件包含用于Elasticsearch和Kibana的目录。

/elasticsearch
|_ README.txt
|_ http.p12
|_ sample-elasticsearch.yml

/kibana
|_ README.txt
|_ elasticsearch-ca.pem
|_ sample-kibana.yml

3、在集群中的每个节点上，完成以下步骤:
复制上面 elasticsearch 文件夹中的 http.p12 到 Elasticsearch 的配置目录下。
编辑 elasticsearch.yml ，启用 HTTPS 安全性，并指定 http.12 文件的位置。

xpack.security.http.ssl.enabled: true
xpack.security.http.ssl.keystore.path: http.p12

将私钥密码添加到 Elasticsearch 的安全设置中。

bin/elasticsearch-keystore add xpack.security.http.ssl.keystore.secure_password

4、重新启动 Elasticsearch

五、配置集群

编辑 elasticsearch.yml（通用配置）

3个节点的配置文件除了ip、节点名之外，都一样

cluster.name: my-clusters
node.name: node-1

path.data: /var/lib/elasticsearch
path.logs: /var/log/elasticsearch

network.host: 0.0.0.0
http.port: 9200
transport.port: 9300

discovery.seed_hosts: ["192.168.72.151", "192.168.72.152","192.168.72.153"]

cluster.initial_master_nodes: ["node-1", "node-2","node-3"]

集群默认是通过9300端口连接的，记得防火墙还要开通9300

关键性能参数

1. 系统级优化（所有节点执行）

# 1. 调整文件描述符限制
echo "* soft nofile 65535" >> /etc/security/limits.conf
echo "* hard nofile 65535" >> /etc/security/limits.conf

# 2. 调整虚拟内存参数
echo "vm.max_map_count=262144" >> /etc/sysctl.conf
sysctl -p

# 3. 禁用交换分区
swapoff -a
sed -i '/swap/s/^/#/' /etc/fstab

# 4. 透明大页禁用
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo "echo never > /sys/kernel/mm/transparent_hugepage/enabled" >> /etc/rc.local

2. JVM 配置 (/etc/elasticsearch/jvm.options)

# 堆内存设置为物理内存的50%（已实际为准）
-Xms32g
-Xmx32g

# 使用G1垃圾回收器
-XX:+UseG1GC
-XX:G1ReservePercent=25
-XX:InitiatingHeapOccupancyPercent=35

# 锁定内存防止交换
-XX:+UseLargePages
-XX:+AlwaysPreTouch

3.配置优化（elasticsearch.yml）

#内存管理参数
indices.memory.index_buffer_size: 15%	#索引写入缓冲区的大小，直接影响批量写入性能
indices.memory.min_index_buffer_size: 64mb	#每个分片的最小缓冲区，避免因分片过多导致内存不足
indices.queries.cache.size: 10%	#缓存过滤器查询结果，加速重复查询
indices.requests.cache.size: 5%	#缓存搜索请求结果，适用于高基数查询
indices.fielddata.cache.size: 20%	#缓存文本字段的聚合/排序数据，但易引发内存溢出
indices.breaker.fielddata.limit: 60%	#限制字段数据缓存占用堆内存的比例，防止OOM
#线程池配置
thread_pool.search.size: 32	#搜索操作的线程数和队列长度，和CPU数量一致
thread_pool.search.queue_size: 1000
thread_pool.analyze.size: 16	#处理分词（如IK Analyzer）等分析任务
thread_pool.analyze.queue_size: 500
#集群与恢复参数
discovery.cluster_formation_warning_timeout: 10s	#集群超时时间
cluster.publish.timeout: 30s	#主节点等待集群状态变更（如分片分配、索引创建）  被所有节点确认的超时时间，默认30s
cluster.routing.allocation.node_initial_primaries_recoveries: 16	#节点初始主分片恢复的并发数
cluster.routing.allocation.node_concurrent_recoveries: 8 #每个节点同时进行的分片恢复（Recovery）操作数量 ，包括主分片分配、副本同步等
indices.recovery.max_bytes_per_sec: 125mb	#限制分片恢复的网络带宽
cluster.routing.allocation.same_shard.host: true	#禁止同一分片的主副本分配到同一主机，增强容错

启动集群

依次启动各个节点

service elasticsearch start

设置密码

bin/elasticsearch-setup-passwords interactive

检查集群状态

curl  -XGET --user elastic:password http://192.168.72.151:9200/_cluster/health?pretty

也可以在浏览器直接访问

请注意，上述步骤中的IP地址、端口和目录路径应根据你的实际环境进行调整。