ES集群重启过程中,出现OOM错误

公司服务器升级,要将原来服务器上ES的数据迁移到新的服务器上去。按照以往的经验,将原来ES的/data目录下的数据复制到新的ES集群下的/data目录,然后等新集群重启完成就可以了。但是这次却遇到了意外状况,新的集群重启过程中,出现了如下错误:

[ERROR][o.e.b.ElasticsearchUncaughtExceptionHandler] [] fatal error in thread [elasticsearch[3Iw-Zj9][clusterService#updateTask][T#1]], exiting
java.lang.OutOfMemoryError: unable to create new native thread
	at java.lang.Thread.start0(Native Method) ~[?:1.8.0_201]
	at java.lang.Thread.start(Thread.java:717) ~[?:1.8.0_201]
	at java.util.concurrent.ThreadPoolExecutor.addWorker(ThreadPoolExecutor.java:957) ~[?:1.8.0_201]
	at java.util.concurrent.ThreadPoolExecutor.processWorkerExit(ThreadPoolExecutor.java:1025) ~[?:1.8.0_201]
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1167) ~[?:1.8.0_201]
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) ~[?:1.8.0_201]
	at java.lang.Thread.run(Thread.java:748) [?:1.8.0_201]

显然,问题原因在于ES在启动时创建了太多线程导致内存不足。我们知道,线程不在堆内存上创建,而在堆内存之外的内存上创建。一个系统能创建的最大线程数,可以由经验公式估算:线程数量=(机器可用内存-JVM分配的堆内存)/Xss的值,Xss(Java thread stack size)指的是线程栈占用空间,Linux系统下默认是1M。由公式可以看出,给JVM分配的内存越多,能创建的线程就越少,越容易发生上述错误。

由此看来,似乎是只需要减少ES的堆内存就能解决问题了,但是实际操作后,依然会发生此错误。除了内存配置的原因外,一些内核参数设置不合理也可能导致上述报错。

vm.max_map_count 是 Linux系统中的一个重要参数,决定了一个进程可以拥有的最大内存映射区域数,也会间接影响线程的创建。内存映射是一种将文件或设备映射到进程的地址空间的技术。通过内存映射,应用程序可以将文件或设备的内容直接加载到内存中,从而更高效地访问数据。这个参数对于ES特别重要,因为ES在运行时会创建大量的内存映射。vm.max_map_count的默认值为65530,建议至少设置为262144。除此之外,ulimit -vulimit -m的结果都应该是unlimited。

修改vm.max_map_count 的值后再重启ES,不再出现OOM的错误。
在这里插入图片描述
参考资料:https://blog.thetaphi.de/2012/07/use-lucenes-mmapdirectory-on-64bit.html

### Elasticsearch 配置文件示例及说明 #### 一、`elasticsearch.yml` 这是Elasticsearch的主要配置文件,位于安装目录下的`config/`文件夹中。此文件用于设置集群名称、节点名称和其他重要参数。 - **cluster.name**: 定义所属的集群名称,默认为`elasticsearch`。同一网络环境下启动多个实例时应指定不同的集群名以防止自动加入错误集群[^2]。 ```yaml cluster.name: my-application ``` - **node.name**: 设置当前节点的名字,在分布式环境中为了区分各个节点而设定。默认情况下会随机选取一个名字。 ```yaml node.name: node-1 ``` - **path.data**: 数据存储路径,可以是一个或多个位置,通过逗号分隔。确保该路径有足够的磁盘空间来保存索引数据。 ```yaml path.data: /var/lib/elasticsearch/data ``` - **network.host**: 绑定地址,0.0.0.0表示监听所有可用接口;localhost仅限本地访问;具体IP则只允许来自特定主机的请求。 ```yaml network.host: 0.0.0.0 ``` - **http.port**: HTTP RESTful API服务端口范围,通常设为9200至9300之间的一个值。 ```yaml http.port: 9200 ``` - **discovery.seed_hosts**: 初始通信节点列表,对于单机版可忽略不计,但在生产环境中的多节点集群里非常重要。 ```yaml discovery.seed_hosts: ["host1", "host2"] ``` - **cluster.initial_master_nodes**: 初始化主节点集合,当首次构建新集群或者重启整个集群时需要用到这个选项。 ```yaml cluster.initial_master_nodes: ["node-1", "node-2"] ``` #### 二、JVM Options (`jvm.options`) 另一个重要的配置文件是`jvm.options`,它控制着运行时虚拟机的行为,比如堆内存大小等关键性能参数: - `-Xms512m`: JVM初始分配给Elasticsearch进程的最小堆栈大小; - `-Xmx512m`: JVM最大能分配给Elasticsearch的最大堆栈容量。 这两个参数应该根据实际硬件条件合理调整,过低可能导致OOM异常,过高又会造成资源浪费。 ```bash -Xms4g -Xmx4g ``` 以上就是一些常见的Elasticsearch配置项及其含义简介。当然还有更多高级特性等待探索,如安全认证机制、跨域资源共享(CORS)策略等等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值