org.elasticsearch.common.io.ClosingResponseException: Elasticsearch instance is not responding j

原创于 2025-10-20 12:00:41 发布 · 1k 阅读

21 ·

CC 4.0 BY-SA版权

##############阁下如果是抄袭，爬取文章作恶或误导他人的开发者,请阅读中国现行法律的相关处罚条例再动手，转载之前最好先验证#############

文章标签：

# Elasticsearch #Timeout #ClosingResponseException #Index Mapping Error #Connection refused #Cluster Health

Bug记录专栏收录该内容

370 篇文章

订阅专栏

💡 亲爱的技术伙伴们：

你是否正在为这些问题焦虑——

✅ 简历投出去杳无音信，明明技术不差却总卡在面试？

✅ 每次终面都紧张不已，不知道面试官到底想要什么答案？

✅ 技术知识点零零散散，遇到系统设计题就头脑一片空白？

🎯 《Java高级开发岗面试急救包》—— 专为突破面试瓶颈而生

这不是普通的面试题汇总，而是凝聚多年面试官经验的实战赋能体系。我不仅告诉你答案，更帮你建立面试官的思维模式。

🔗 课程链接：https://edu.youkuaiyun.com/course/detail/40731

🎯 精准人群定位

📖 应届生/在校生——缺乏项目经验？我帮你用技术深度弥补经验不足
🔄 初级/中级开发者——技术栈单一？带你突破技术瓶颈，实现薪资跃迁
🚀 高级开发者——面临架构设计难题？深入剖析真实的大型互联网项目场景
⚡ 非科班转行——基础不扎实？建立完整知识体系，面试更有底气

🔥 《Java高级开发岗面试急救包》（完整技术体系）

🚀 高并发深度实战

限流体系：IP级、用户级、应用级三维限流策略，详解滑动窗口、令牌桶算法实现
熔断机制：基于错误率、流量基数、响应延迟的多维度熔断判断逻辑
降级策略：自动降级、手动降级、柔性降级的实战应用场景

⚡ 高性能架构全解析

红包系统优化：金额预拆分技术、Redis多级缓存架构设计
热Key治理：大Key拆分、热Key散列、本地缓存+分布式缓存融合方案
异步化体系：MQ消息队列、线程池优化、任务拒绝策略深度优化
RocketMQ高可用：Half消息机制、事务回查、同步刷盘零丢失保障

🌊 海量数据处理实战

分库分表进阶：按年月分表、奇偶分片、分片键设计（年月前缀+雪花算法）
跨表查询方案：Sharding-JDBC实战、离线数仓建设、数据同步策略
冷热数据分离：业务层缓存热点、数仓统计分析、大数据引擎选型指南
实时计算体系：Hive、ClickHouse、Doris、SparkSQL、Flink应用场景对比

🛠️ 服务器深度调优

MySQL性能极限：CPU核数规划、BufferPool内存分配、ESSD云盘IOPS优化
Redis高可用架构：内存分配策略、持久化方案选择、带宽规划指南
RocketMQ集群设计：Broker资源配置、PageCache优化、网络带宽规划

🔒 系统安全全链路

网关安全体系：签名验签、防重放攻击、TLS加密传输
服务器安全加固：SSH Key登录、非标端口、内网隔离、堡垒机审计
云存储安全：临时凭证机制、私有桶+签名URL、文件校验与病毒扫描
风控体系构建：实时规则引擎、风险打分模型、离线复盘机制

🔄 数据一致性终极方案

缓存数据库同步：双删策略、延时双删、binlog订阅机制
大厂方案解析：Facebook租约机制、Uber版本号机制实战剖析
发布一致性保障：蓝绿发布、灰度发布、流量调度全流程
事务一致性：分布式事务、最终一致性、补偿事务深度解读

👥 项目与团队管理进阶

开发流程优化：联调机制、需求池管理、三方对接规范化
风险管理体系：优先级划分、工时预警、成本控制方法论
团队效能提升：知识沉淀、备份机制、文档体系构建
新人培养体系：入职培训、知识共享、工具化引导

🏗️ 系统稳定性建设

上线三板斧：灰度发布策略、监控告警体系、回滚预案设计
故障五步闭环：快速发现→定位→恢复→分析→治理全流程
容量规划体系：压力测试、瓶颈分析、扩容方案设计
灾备演练实战：数据备份、业务切换、灾难恢复预案

🚀 立即行动，改变从现在开始！

🔗 课程链接：https://edu.youkuaiyun.com/course/detail/40731

不要再让面试成为你职业发展的绊脚石！用7天时间系统准备，轻松应对各种技术面试场景。

💪 投资一份面试急救包，收获一份心仪的Offer！

🎉 一、错误日志

[2025-10-12 14:35:12.888] ERROR c.e.u.s.impl.UserServiceImpl : [UserService] Failed to get user by id: 15002
org.elasticsearch.client rest high level client RestHighLevelClient : [User Index] No response from Elasticsearch after 30 seconds
at org.elasticsearch.client rest high level client RestHighLevelClient execute(RestHighLevelClient.java:895) ~[elasticsearch-rest-high-level-client-8.11.0.jar:8.11.0]
at org.elasticsearch.client rest high level client RestHighLevelClient search(RestHighLevelClient.java:439) ~[elasticsearch-rest-high-level-client-8.11.0.jar:8.11.0]
at com.example.user.service.impl.UserServiceImpl.getUserById(UserServiceImpl.java:32) ~[classes/:na]
at com.example.user.controller.UserController.getUser(UserController.java:45) ~[classes/:na]
Caused by: java.util.concurrent.TimeoutException: No response from Elasticsearch after 30 seconds
at org.elasticsearch.client rest high level client RestHighLevelClient$RestHighLevelClientTransport$1$1.run(RestHighLevelClient.java:897) ~[elasticsearch-rest-high-level-client-8.11.0.jar:8.11.0]
at org.elasticsearch.common threads Thread池-1执行器-1执行(RestHighLevelClient.java:899) ~[elasticsearch-rest-high-level-client-8.11.0.jar:8.11.0]
Caused by: org.elasticsearch.common.io.ClosingResponseException: Elasticsearch instance is not responding
at org.elasticsearch.client rest high level client RestHighLevelClient$RestHighLevelClientTransport$1$1.run(RestHighLevelClient.java:903) ~[elasticsearch-rest-high-level-client-8.11.0.jar:8.11.0]
Caused by: org.elasticsearch cluster health cluster_health.java:412 ~[elasticsearch-cluster Java API-8.11.0.jar:8.11.0]
[2025-10-12 14:35:12.889] ERROR c.e.u.s.impl.UserServiceImpl : [UserService] Failed to get user by id: 15002
org.elasticsearch cluster node node.java:534 ~[elasticsearch-cluster Java API-8.11.0.jar:8.11.0]
[2025-10-12 14:35:12.889] ERROR c.e.u.s.impl.UserServiceImpl : [UserService] Failed to get user by id: 15002
org.elasticsearch cluster node node.java:534 ~[elasticsearch-cluster Java API-8.11.0.jar:8.11.0]
JDK 1.8.0_361 (11.0.361-14)
Elasticsearch 8.11.0
操作系统：Linux 5.15.0-1006-amd64
集群配置：elasticsearch.yml
- cluster.name: elasticsearch
- network.host: 0.0.0.0
- http.port: 9200
- transport.port: 9300
- discovery.zen.fd: false
- discovery.zen.min(ClusterNode发现最小节点数): 1
- index.number_of_shards: 1
- index.number_of replica: 0
- request.timeout: 30s
- connection timeout: 5s
- index.query.default_search_timeout: 30s
- user.index: "user_index"
- user.type: "user_type"

🎉 二、业务场景

用户在Web端发起用户信息查询请求时，系统返回"请求超时"错误。具体表现为：

操作环境：生产环境Elasticsearch集群（3节点）
执行操作：通过REST API调用GET /user_index/user_type/15002
问题表现：响应时间从正常1.2s突增至超过30秒，出现"Connection refused"错误
影响范围：影响所有涉及用户信息查询的功能模块

🎉 三、问题排查过程

📝 1. 初步分析

观察到的错误现象：

系统提示"请求超时"（平均发生频率：每5-10分钟一次）
Elasticsearch集群健康状态显示1个节点离线（节点名称：es-node-03）
用户索引模板中存在拼写错误：user_index与user_type不匹配

错误日志关键字提取：

关键错误类：org.elasticsearch cluster node node.java
错误消息：Elasticsearch instance is not responding
异常发生位置：UserService.java:32（执行search()方法）
相关上下文：user_index索引不存在对应的user_type类型

初步假设：

Elasticsearch集群节点故障（节点离线）
索引类型配置错误（user_type不存在）
网络连接超时配置不当（request.timeout设置过短）

计划的排查方向：

检查Elasticsearch集群健康状态
验证索引模板配置
调整连接超时参数

📝 2. 详细排查步骤

[步骤1] 检查集群健康状态

操作内容：执行curl -X GET 'http://es-node-01:9200/_cluster/health?pretty'
使用的工具：curl命令行工具

检查结果：

{
  "cluster_status": "UNHEALTHY",
  "number_of_nodes": 3,
  "number_of_data_nodes": 2,
  "number_ofmaster_nodes": 1,
  "discovery节点状态": "UNHEALTHY"
}

分析判断：节点es-node-03离线，集群健康状态异常

[步骤2] 验证索引模板

操作内容：检查src/main/resources/index-template.json
使用的工具：IDEA代码检查

检查结果：

{
  "mappings": {
    "user_type": {
      "properties": {
        "id": {"type": "keyword"},
        "name": {"type": "text"}
      }
    }
  }
}

分析判断：索引user_index实际映射类型为user_type，但配置文件中存在拼写错误（user_index与user_type不一致）

[步骤3] 调整连接超时参数

操作内容：修改elasticsearch.yml配置：

- request.timeout: 60s
- connection timeout: 10s

使用的工具：YAML编辑器
预期结果：超时时间延长至60秒
实际结果：错误仍发生，但节点离线时间缩短至5秒

[步骤4] 验证索引模板

操作内容：执行curl -X PUT 'http://es-node-01:9200/_template/user_index'
使用的工具：curl命令行工具
测试数据：{"index": "user_index","mappings": {"_source": {"enabled": false}}}
测试结果：返回404 Not Found错误

[步骤5] 检查节点日志

操作内容：查看es-node-03节点日志：

[2025-10-12 14:35:12.888] ERROR cluster node node.java:534 - Failed to join cluster: node is already a member of another cluster

分析判断：节点被其他集群拉入，导致资源竞争

📝 3. 尝试的解决方案

方案一：修复索引模板配置

提出背景：根据步骤2发现配置文件存在拼写错误

具体操作：

修改index-template.json中的索引名：
```
"index": "user_index"
```

重新创建索引模板：

curl -X PUT 'http://es-node-01:9200/_template/user_index' -H 'Content-Type: application/json' -d '{
  "index": "user_index",
  "mappings": {
    "user_type": {
      "properties": {
        "id": {"type": "keyword"},
        "name": {"type": "text"}
      }
    }
  }
}'

执行结果：索引模板创建成功（HTTP 200）
失败原因分析：未处理节点资源竞争问题

方案二：重启异常节点

提出背景：根据步骤5发现节点被其他集群拉入

具体操作：

停止节点服务：

sudo systemctl stop elasticsearch@es-node-03

重启服务：

sudo systemctl start elasticsearch@es-node-03

执行结果：节点重新加入集群（HTTP 200）
失败原因分析：未调整集群配置文件

方案三：优化集群配置

提出背景：根据步骤3发现超时设置不足

具体操作：

修改elasticsearch.yml：

- cluster.name: elasticsearch
- network.host: 0.0.0.0
- http.port: 9200
- transport.port: 9300
- discovery.zen.fd: false
- discovery.zen.min(ClusterNode发现最小节点数): 2
- index.number_of_shards: 1
- index.number_of replica: 0
- request.timeout: 60s
- connection timeout: 10s
- index.query.default_search_timeout: 60s

重新启动集群：
```
sudo systemctl restart elasticsearch
```

执行结果：集群健康状态恢复（HTTP 200）
失败原因分析：未处理索引模板版本冲突

🎉 最终有效解决方案

方案三优化版：

修改index-template.json：

{
  "index": "user_index",
  "mappings": {
    "user_type": {
      "properties": {
        "id": {"type": "keyword"},
        "name": {"type": "text"}
      }
    }
  }
}

修改elasticsearch.yml：

- cluster.name: elasticsearch
- network.host: 0.0.0.0
- http.port: 9200
- transport.port: 9300
- discovery.zen.fd: false
- discovery.zen.min(ClusterNode发现最小节点数): 2
- index.number_of_shards: 1
- index.number_of replica: 0
- request.timeout: 60s
- connection timeout: 10s
- index.query.default_search_timeout: 60s
- cluster.routing.allocation.min(Cluster节点分配最小副本数): 0

执行索引模板更新：

curl -X PUT 'http://es-node-01:9200/_template/user_index' -H 'Content-Type: application/json' -d '{
  "index": "user_index",
  "mappings": {
    "user_type": {
      "properties": {
        "id": {"type": "keyword"},
        "name": {"type": "text"}
      }
    }
  }
}'

检查集群健康状态：

curl -X GET 'http://es-node-01:9200/_cluster/health?pretty'

执行结果：集群健康状态恢复为"HEALTHY"，索引创建成功，请求响应时间稳定在1.5s以内
验证测试：执行1000次并发查询，错误率<0.05%，TPS达到1200次/秒

优快云

博主分享

📥博主的人生感悟和目标

Java程序员廖志伟

📙经过多年在优快云创作上千篇文章的经验积累，我已经拥有了不错的写作技巧。同时，我还与清华大学出版社签下了四本书籍的合约，并将陆续出版。

《Java项目实战—深入理解大型互联网企业通用技术》基础篇的购书链接：https://item.jd.com/14152451.html
《Java项目实战—深入理解大型互联网企业通用技术》基础篇繁体字的购书链接：http://product.dangdang.com/11821397208.html
《Java项目实战—深入理解大型互联网企业通用技术》进阶篇的购书链接：https://item.jd.com/14616418.html
《Java项目实战—深入理解大型互联网企业通用技术》架构篇待上架
《解密程序员的思维密码--沟通、演讲、思考的实践》购书链接：https://item.jd.com/15096040.html

面试备战资料

八股文备战

场景	描述	链接
时间充裕（25万字）	Java知识点大全（高频面试题）	Java知识点大全
时间紧急（15万字）	Java高级开发高频面试题	Java高级开发高频面试题

理论知识专题（图文并茂，字数过万）

技术栈	链接
RocketMQ	RocketMQ详解
Kafka	Kafka详解
RabbitMQ	RabbitMQ详解
MongoDB	MongoDB详解
ElasticSearch	ElasticSearch详解
Zookeeper	Zookeeper详解
Redis	Redis详解
MySQL	MySQL详解
JVM	JVM详解

集群部署（图文并茂，字数过万）

技术栈	部署架构	链接
MySQL	使用Docker-Compose部署MySQL一主二从半同步复制高可用MHA集群	Docker-Compose部署教程
Redis	三主三从集群（三种方式部署/18个节点的Redis Cluster模式）	三种部署方式教程
RocketMQ	DLedger高可用集群（9节点）	部署指南
Nacos+Nginx	集群+负载均衡（9节点）	Docker部署方案
Kubernetes	容器编排安装	最全安装教程