es集群启动失败failed to join

最新推荐文章于 2024-06-27 22:29:37 发布

原创最新推荐文章于 2024-06-27 22:29:37 发布 · 1.8k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch

Elasticsearch 专栏收录该内容

3 篇文章

订阅专栏

在Windows环境下，使用JDK8运行三个相同bin目录的实例时出现启动失败问题，错误信息包括'failed to join'和'failure when sending a validation request to node'。解决建议是删除除第一个实例外其他实例的数据目录后再重启，以避免节点验证失败导致的启动冲突。

情况：window，jdk8，一个bin下启动3个实例（不是3个bin目录）

启动时报错，报类似的错

failed to join ...
failure when sending a validation request to node ...

可以尝试把除了第一个实例外的其他实例的data目录删掉，然后重新启动实例。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

csdnyq

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【ElasticSearch】Es 启动流程初始化流程源码分析

九师兄

04-21

940

Elasticsearch的bootstrap代码写得很好的server，当中包含了大量的自检和环境检测代码，甚至用到了JNA来做OS层面的参数获取和设置。Elasticsearch的启动流程主要涉及Elasticsearch、Bootstrap和Node三个类。主要包括加载三个步骤：加载本地环境：读取命令行参数和配置文件，生成本地环境配置创建Node：创建节点实例，创建各种服务类对象，注入各种功能模块启动Node：启动各种服务，加入集群。

解决：ES报错failed to send join request to master

Jecky的博客

09-18

3214

报错：failed to send join request to master [{hadoop103}{0N-QeaPVRT-iv54NU1nlqQ}{fhTrVKVVR3i3V0UcK1TCXg}{192.168.1.222}{192.168.1.222:9300}{rack=r1}], reason [RemoteTransportException[[hadoop103][192.168.1.222:9300][internal:discovery/zen/join]]; nested: Con.

参与评论您还未登录，请先登录后发表或查看评论

ES failed to send join request to master

weixin_38875344的博客

04-12

2252

配置ES 集群报错之前配置ES 集群配置文件写好之后，我首先启动单节点测试一下，然后在启动集群。使用head连接ES 查看状态的时候，发现集群无法连接。但是9100端口可以访问。集群状态无法连接。各种查阅资料。都没能解决问题，到底是哪里出来问题呢？突然想到应该有错误日志。于是后知后觉的去查看错误日志，果不其然， [2019-04-12T16:47:00,358][INFO ][o....

ES踩坑记录之集群间通信异常造成节点无法加入

大叶子不小的博客

08-14

2918

公司新搭了一套ES集群，4台机器，ES版本7.5.0，前期搭建十分顺利，但集群运行一段时间后会出现问题。问题具体体现为节点间通讯异常，集群会重新选主，但选主之后只能通过新的主节点进行集群操作，其他节点无法加入主节点。从现象上看，集群中原本node-1为主节点，现在node-2成了主节点，也就是说原本主节点出现了问题，导致集群重新选主。这里有两个问题，首先node-1原本是主节点，为什么它要加入别人的节点？经过一阵研究我们发现，原来还是主机之间的通讯有些问题，我们需要修改一下主机之间的通讯保持参数。

Failed to join domain GSS2.02 AD2008

weixin_34409703的博客

02-18

334

本文解决的是客户端加入2008域失败的问题。最后解决的方法很简单，主要是想写一下分析解决问题的流程。问题描述：客户端是WinXP SP3。域刚刚由2003 upgrade到了Windows2008。一台GC、一台DC都是2008 Ghost服务器是Symantec Ghost Solution Suite 2.02。当使用到加入域的Configuration时...

Es启动报错 failed to send join request to master

张不帅

06-18

1992

[ekl01] failed to send join request to master [{ekl02}{Xw4iXnLHRti5WYs722z_3A}{wEq5izB_QUWOww2-o_7S_g}{elk02}{192.168.18.11:9300}{ml.machine_memory=1911857152, ml.max_open_jobs=20, xpack.installed=true, ml.enabled=true}], reason [RemoteTransportException[[

ElasticSearch集群选举

panxj856856的博客

08-10

3350

上一篇分析了es集群选举前，每个节点通过ping()获取集群内其他节点的信息。这一次从整体分析下es集群选举master的流程。在Node节点的start()方法中，通过discovery.startInitialJoin()方法开始加入集群，并参与选举。 @Override public void startInitialJoin() { // start...

ElasticSearch集群发现，解答使用Docker部署ES集群时留下的疑惑

吴就业

03-14

550

如果当前是线上环境，我突然启动一个服务，但并不想加入到集群中，但是节点启动就发广播，线上的服务接收到广播就认为你要新增节点了。这样得到的结果就是一个节点意外的加入到了生产环境，仅仅是因为一个错误的组播信号。一样，我的目的只是去了解一些我想要了解的，并不打算深入去研究，所以我也不会去翻看源码。的流程，而不是单单解释源码每一行是什么意思，这样分析源码实际上也没什么意思。自定义的服务发现协议去按照多播的方式来寻找网络上配置在同样集群内的节点。集群内部，从一个节点到另一个节点的每个调用都使用传输模块。

ElasticSearch启动报错总结（不断更）

weixin_56044831的博客

10-14

2124

1. ERROR: [1] bootstrap checks failed:max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144] 解决方案: su - root 切换root账户 vim/etc/sysctl.conf 编辑此文件添加 vm.max_map_count=262144 在文件末尾执行/sbin/sysctl -p 立即生效重新启动即可 2....

ElasticSearch7.4集群需要注意的问题（从节点加入不成功）

chuixue24的博客

01-17

2814

安装环境为win10，把之前启动过，且已经有数据的ElasticSearch7.4文件夹直接复制了一份，然后启动时发现，从节点不能加入主节点。报错如下： org.elasticsearch.transport.RemoteTransportException: [ES-node2][192.168.200.56:9301][internal:cluster/coordination/join] ...

elasticsearch7.6 各个节点加入集群失败

u014174786的博客

04-21

1902

不要复制节点文件目录到其他集群，复制的节点目录无法加入主节点

ES集群报错 failed to send join request to master

tootsy_you的博客

08-02

1432

今天搭建es集群，报错failed to send join request to master错误如下原因是：节点时scp拷过去的，节点有了其他节点的data，删除后重启即可

elasticsearch 集群无法启动出现如下提示 failed to send join request to master

w764545780的博客

06-07

575

[node-2] faile`在这里插入代码片`d to send join request to master [{node-1}{WbcP0pC_T32jWpYvu5is1A}{2_LCVHx1QEaBZYZ7XQEkMg}{10.10.11.200}{10.10.11.200:9300}], reason [RemoteTransportException[[node-1][10.10.11.200:9300][internal:discovery/zen/join]]; nested: Illega

elasticsearch: failed to send join request to mast

qq_29419791的博客

09-30

791

本机IP是：192.168.164.729, 但是在注册成es节点时的IP确是 172.17.0.1，查看下了该节点所在机器的网卡信息，172.17.0.1 这个是被docker虚拟出来的地址，而ES集群中只有该节点装有docker，导致不能通过 172.17.0.1跟其他192.168.164.*上的节点通信。修改es的配置，将修改为 network.host: 192.168.164.729, 然后本机测试 192.168.164.729:9200,访问OK

[ES] ElasticSearch节点加入集群失败经历分析主节点选举、ES网络配置 [publish_address不是当前机器ip]

浣花御劍

05-11

2435

ES节点加入集群失败，publish_address非当前机器ip地址，问题排查与分析，官网背书

emqx集群搭建：加入集群失败？订阅相同主题消息收不到？

qq_37187180的博客

03-16

4816

手动(manual) 方式管理集群介绍假设要在两台服务器 s1.emqx.io, s2.emqx.io 上部署 EMQ X 集群: 节点名主机名 (FQDN) IP 地址 emqx@s1.emqx.io 或 emqx@192.168.0.10 s1.emqx.io 192.168.0.10 emqx@s2.emqx.io 或 emqx@192.168.0.20 s2.emqx.io 192.168.0.20 注意：节点名格式为 Name@Host, Host 必须是 IP 地址

搭建elsticsearch集群报错 failed to send join request to master [{data-node-0}(已经测试)

gb4215287的博客

11-29

1170

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.youkuaiyun.com/qq_24879495/article/details/77718032 搭建elsticsearch集群的时候，先用windows 10和 ubuntu 16.04试了一下，发现可以。然后将虚拟机里的ubunut复制一份，然后一直报错如下： [2017-08-30T15:17:40,016]...

Elasticsearch8节点加入集群失败解决方法

weixin_42264524的博客

01-02

2500

Elasticsearch节点加入集群失败解决方法，failed to join

k8s集群node节点加入失败

weixin_45309589的博客

06-27

1262

6月 27 22:01:42 nodeOne kubelet[7665]: E0627 22:01:42.803879 7665 kubelet.go:2347] "Container runtime network not ready" networkReady="NetworkReady=false reason:NetworkPluginNotReady message:docker: network plugin is not ready: cni config uninitialized"

Elasticsearch集群多机部署，无法组件集群，网络正常，

最新发布

10-24

<think>我们正在处理Elasticsearch集群多机部署无法组建集群但网络正常的问题。根据引用内容，我们可以总结以下可能的解决方案： 1. **检查集群配置一致性**：确保所有节点具有相同的`cluster.name`（引用[4]中配置为`es-cluster`）[^4]。 2. **检查节点发现设置**：在引用[4]中，`discovery.seed_hosts`需要列出所有节点（包括端口9300）[^4]。确保每个节点的这个配置都包含了集群中所有其他节点的IP和端口（通常是9300）。 3. **检查初始主节点设置**：引用[4]中`cluster.initial_master_nodes`在初始化集群时设置，后续启动可以去掉[^4]。如果集群已经初始化过，新节点加入时不需此配置。 4. **删除旧数据**：引用[3]提到，如果每个节点都认为自己是主节点（脑裂），可以尝试删除数据目录下`_state`文件夹的内容并重启[^3]。 5. **检查网络配置**：虽然用户说网络正常，但还是要确认节点间9300端口是否互通（可用`telnet`或`nc`测试）。 6. **检查防火墙或安全组**：确保节点间9300-9400端口（根据配置）开放。 7. **检查节点名称**：每个节点的`node.name`必须唯一（如引用[4]中的node1, node2等）[^4]。 8. **检查日志**：查看Elasticsearch日志（默认在配置的path.logs目录下），通常位于`logs/<cluster-name>.log`，从中可以找到错误信息。具体步骤： ### 步骤1: 检查集群配置确保每个节点的`elasticsearch.yml`配置正确： - `cluster.name`：所有节点相同。 - `node.name`：每个节点唯一。 - `discovery.seed_hosts`：每个节点都应列出所有节点的9300端口地址（例如：["192.168.0.10:9300", "192.168.0.11:9300", "192.168.0.12:9300"]）[^4]。 - 如果是新集群初始化，确保其中一个节点的配置中包含`cluster.initial_master_nodes`（例如：["node1"]），并且这个节点是第一次启动。集群形成后，这个配置可以移除或注释掉。 ### 步骤2: 清除旧数据（如果适用）如果之前尝试组建集群失败，可能会有残留的状态数据。在每个节点上： 1. 停止Elasticsearch。 2. 删除数据目录（在配置文件中`path.data`设置的目录）下的`_state`文件夹（引用[3]）[^3]。 3. 重启节点。注意：删除`_state`文件夹会清除节点已知的集群状态，但不会删除索引数据。如果是全新安装，可以直接删除整个数据目录。 ### 步骤3: 检查网络连通性在每台机器上测试其他节点的9300端口： ```bash telnet 目标节点IP 9300 ``` 或使用`nc`： ```bash nc -zv 目标节点IP 9300 ``` ### 步骤4: 检查防火墙如果是云服务器，检查安全组规则；如果是本地虚拟机或物理机，检查防火墙（如iptables/firewalld）是否允许9300端口。 ### 步骤5: 查看日志启动Elasticsearch后，查看日志文件（如`logs/<cluster-name>.log`），搜索关键字如`discovery`, `cluster`, `master_not_found`等。 ### 步骤6: 考虑安全配置（如启用安全特性）引用[1]提到启动第二、三台节点时需要第一台的秘钥（30分钟有效期）[^1]。如果集群启用了安全特性（如8.0默认启用），则需要按照安全引导流程操作。确保在生成引导令牌后及时在其他节点上使用。如果按照以上步骤检查，通常可以解决集群组建问题。如果问题依旧，请根据日志进一步分析。生成相关问题： §§相关问题§§ 1. Elasticsearch集群脑裂问题的预防和解决方法？ 2. 如何配置Elasticsearch的SSL加密通讯？ 3. Elasticsearch集群节点角色如何分配优化？ </think>针对Elasticsearch集群多机部署无法组建集群但网络正常的问题，结合引用内容和实践经验，以下是分步解决方案： --- ### 一、检查核心配置（必做项） 1. **集群名称一致性** ```yaml:elasticsearch.yml cluster.name: es-cluster # 所有节点必须相同[^4] ``` 2. **节点发现机制配置** ```yaml:elasticsearch.yml discovery.seed_hosts: - "192.168.0.10:9300" # 节点1 - "192.168.0.11:9300" # 节点2 - "192.168.0.12:9300" # 节点3 cluster.initial_master_nodes: - "node1" # 仅初始主节点需声明[^4] ``` 3. **节点名称唯一性** ```yaml:elasticsearch.yml node.name: node1 # 每个节点名称唯一（如node1/node2/node3）[^4] ``` --- ### 二、清除旧状态数据（关键步骤）若节点独立启动未形成集群，需操作： ```bash # 停止所有节点服务 systemctl stop elasticsearch # 删除数据目录下的状态文件 rm -rf /etc/elastic/data/_state/* # 路径参考path.data配置[^3] # 启动顺序：先启动初始主节点（node1），再启动其他节点[^1] ``` > **原理**：残留状态文件可能导致节点认为自己是孤立主节点[^3] --- ### 三、验证网络层连通性 ```bash # 节点间互测9300端口 nc -zv 192.168.0.10 9300 # 从节点2测试节点1 nc -zv 192.168.0.11 9300 # 从节点1测试节点2 ``` > **注意**：云服务器需检查安全组规则是否开放9300端口[^2] --- ### 四、日志排查路径查看日志定位具体错误： ```bash tail -f /home/es/elasticsearch/logs/es-cluster.log # 参考引用[1]日志路径 ``` 常见错误关键词： - `master_not_discovered` - `failed to join` - `Validation Failed: 1`（配置校验失败） --- ### 五、高级调试方案若仍失败，尝试禁用安全模块（测试环境）： ```yaml:elasticsearch.yml xpack.security.enabled: false # 关闭SSL和密码验证[^2] ``` > 生产环境建议保留安全配置，但需确保所有节点使用相同证书[^1] ---