NameNode: Permission denied&无法启动Hadoop解决方法

最新推荐文章于 2024-06-30 17:30:39 发布

炽天使YRLT

最新推荐文章于 2024-06-30 17:30:39 发布

阅读量1.3w

点赞数 9

分类专栏： Hadoop学习之路文章标签： hadoop linux 大数据

本文链接：https://blog.youkuaiyun.com/eyexin2018/article/details/109731190

版权

Hadoop学习之路专栏收录该内容

13 篇文章

订阅专栏

本文解决NameNode权限问题，通过添加公钥并修改Hadoop脚本参数，确保HDFS和YARN服务使用正确用户启动。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

NameNode: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

就是这个原因
这个问题的出现主要是因为没有给authorized_keys授权，解决方法如下：
把产生的公钥文件放置到authorized_keys文件中，命令如下：

[root@node1 etc ]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[root@node1 etc ]# chmod 0600 ~/.ssh/authorized_keys

无法启动Hadoop解决方法：

在Hadoop安装目录下找到sbin文件夹
在里面修改四个文件
1、对于start-dfs.sh和stop-dfs.sh文件，添加下列参数：

1.	#!/usr/bin/env bash
2.	HDFS_DATANODE_USER=root
3.	HADOOP_SECURE_DN_USER=hdfs
4.	HDFS_NAMENODE_USER=root
5.	HDFS_SECONDARYNAMENODE_USER=root

2、对于start-yarn.sh和stop-yarn.sh文件，添加下列参数：

1.	#!/usr/bin/env bash
2.	YARN_RESOURCEMANAGER_USER=root
3.	HADOOP_SECURE_DN_USER=yarn
4.	YARN_NODEMANAGER_USER=root

重新开始start…就可以。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

炽天使YRLT

关注关注

9
点赞
踩
24

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hadoop启动报错 master: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

m0_69097184的博客

10-18

4265

Starting namenodes on [master] master: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). Starting datanodes Starting secondary namenodes [master] master: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

【大数据/踩坑/Linux】启动HDFS报错localhost: Permission denied (publickey,password).

m0_51371693的博客

12-26

1043

hdfs启动权限问题报错，给出几种可能解决办法

3 条评论您还未登录，请先登录后发表或查看评论

hadoop namenode启动报Permission denied

shouwangV6的专栏

11-14

4487

昨天需要重启一下集群，集群是chd版的，重启后发现namenode启动不了，查看日志一直报这个错 2015-11-13 21:56:14,538 INFO org.apache.hadoop.http.HttpServer2: Jetty bound to port 50070 2015-11-13 21:56:14,538 INFO org.mortbay.log: jetty-6.1.26

hadoop开启namenode出现Permission defined，解决方式

weixin_44047573的博客

02-10

711

hadoop开启namenode出现Permission defined，解决方式

Hadoop集群启动时,nameNode进程没有启动 :Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)解决方法

m0_48042447的博客

06-28

1890

前言今天搭建Hadoop集群的最后,启动hadoop集群后,发现nameNode进程并没有启动,基于相信自己的原则,我一直认为我已经将生成的公钥添加到本地的认证文件中,排查了半天,最终还是选择,查看一下认证文件,果然缺少一个节点的公钥.所以纪念一下 cat id_rsa.pub >> authorized_keys 或者 cp id_rsa.pub authorized_keys ...

hadoop开启NameNode和DataNode守护进程，发现Permission denied

Chocological7的博客

10-27

2039

可能是之前配置SSH无密码登录时出现错误，需要重新进行SSH链接公钥认证。

hdfs namenode -format bash: /e3base/hadoop/bin/hdfs: Permission denied

似水流年

12-23

2491

hdfs namenode -format bash: /e3base/hadoop/bin/hdfs: Permission denied 执行的命令的权限被拒绝解决方案： chmod 777/756 文件名扩大文件的权限即可修改文件的所在的用户及其组的名称 chown 组名.用户名文件名即可

二百一十八、Hadoop——Hadoop启动报错Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)

tiantang2renjian的博客

12-13

2179

Hadoop启动报错Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)

开启hadoop报错：localhost: Permission denied(publickey,gssapi-keyex,gssapi-with-mic,password).

eating的博客

03-13

1万+

提示：虚拟机问题文章目录前言报错：localhost: Permission denied(publickey,gssapi-keyex,gssapi-with-mic,password). 前言配置虚拟机的时候总会有大大小小的错，帮大家避雷吧！报错：localhost: Permission denied(publickey,gssapi-keyex,gssapi-with-mic,password). 开启Hadoop的时候报错解决方法（如下）：只需要执行： ssh-copy-id .

hadoop配置过程中可能会出的问题localhost: root@localhost: Permission denied (publickey,password).

热门推荐

qq_44166946的博客

11-19

3万+

在配置好了hadoop基础开发环境过后尝试执行sudo sbin/start-dfs.sh出现了下列问题， Starting namenodes on [localhost] localhost: root@localhost: Permission denied (publickey,password). 网上查了一下说是配置ssh免登录的问题解决了就行了。但我其实是配置好了本地免登录在进行的这一步，当我执行ssh localhost时可以免密码登录，但是当我执行ssh root@localhost时不能

hadoop启动permission denied报错

weixin_60210734的博客

12-19

1174

界定问题花费了大量时间，主要测试SSH问题和集群节点用户名字。

hadoop中启动namenode等出现的一些问题

weixin_34080951的博客

03-14

459

hadoop的配置是参考这篇教程的http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/ 初次配置运行没什么问题MapReduce的例子也能正常运行，但是等若干天后再次运行时遇到了如下的问题: hadoop@ubuntu:~$ hadoop/bin/...

在安装HDFS过程中遇见Permission denied

qq_65231448的博客

06-30

640

想必有同学在实战Shell的时候，遇到了： Permission denied: user=root, access=WRITE, inode="/":hadoop:supergroup:drwxr-xr-x 这种类似的问题。问题的原因就是没有权限，那么为什么呢？

搭建hadoop报错node1: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

Miracle1203的博客

03-06

2万+

启动hadoop伪分布式集群报错 node1: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). node2: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 数据节点node1和node2为正常启动，如图在网上找了很...

Hadoop的namenode无法启动问题（50070无法访问，50030可以访问）

曹世超的专栏

08-31

1万+

2013-08-31 10:29:31,241 ERROR org.apache.hadoop.hdfs.server.namenode.FSNamesystem: FSNamesystem initialization failed.java.io.FileNotFoundException: /opt/data/hadoop/hdfs/name/current/VERSION (Permiss

Hadoop服务启动出现Permission denied (publickey,password).

weixin_43484977的博客

03-18

1万+

办法：需要设置免密连接登录首先运行 ssh localhost 如果还要输入密码的话，那就是你ssh没有配置好。这里要说一下的是ssh7.0之后就关闭了dsa的密码验证方式，如果你的秘钥是通过dsa生成的话，需要改用rsa来生成秘钥 ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/au...

namenode和datanode启动失败

weixin_30326741的博客

02-05

566

1.namenode启动失败，查看错误原因，是无法格式化，再看日志，根据日志提示，清空对应的目录，即可解决这个问题。 2.datanode启动失败： Can't open /var/run/cloudera-scm-agent/process/261-hdfs-DATANODE/supervisor.conf: Permission denied. cd到/var/r...

Node报错“permission denied,”解决办法

云深海阔专栏

05-13

9189

报错信息：stack Error: EACCES: permission denied, mkdir '/root/.jenkins/workspace/Acl-bound-Project-AwsProd/node_modules/node-sass/.node-gyp' [root@manage-host Acl-bound-Project-AwsProd]# mkdir ~/npm-global 您在 /var/spool/mail/root 中有新邮件 [root@manage-host A.

当我们尝试运行webpack-dev服务时，报node_modules/.bin/webpack-dev-server: Permission denied权限被拒绝要如何解决？

mazhifeixxr的博客

01-12

2013

权限被拒绝？

[root@hadoop01 ~]# start-dfs.sh Starting namenodes on [hadoop01] hadoop01: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). Starting datanodes hadoop03: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). hadoop01: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). hadoop02: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). Starting secondary namenodes [hadoop0i] hadoop0i: ssh: Could not resolve hostname hadoop0i: Name or service not known 2025-03-14 08:18:36,316 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable [root@hadoop01 ~]# jps 95328 Jps 2282 ResourceManager以上是什么问题

最新发布

03-15

<think>好的，我现在需要帮助用户解决他们在启动Hadoop的HDFS时遇到的问题。用户提供了执行start-dfs.sh后的错误日志，以及jps的输出。我需要分析这些错误信息，找出可能的原因，并提供解决方案。首先，用户遇到的错误信息主要是“Permission denied (publickey,...)”以及主机名解析问题。看起来涉及SSH免密登录失败和主机名配置错误。让我先分解问题： 1. **Permission Denied错误**：在启动namenode和datanode时，多个节点（hadoop01, hadoop02, hadoop03）出现权限拒绝，提示公钥认证失败，可能SSH配置有问题。用户之前可能已经设置了SSH免密登录，但似乎没有生效。 2. **Secondary namenode启动失败**：错误提示无法解析主机名“hadoop0i”，这可能是一个拼写错误，正确的主机名可能是hadoop01或者其他正确的主机名。 3. **JPS输出显示只有ResourceManager和Jps**：说明HDFS的相关进程（如NameNode、DataNode、SecondaryNameNode）没有成功启动，可能因为前面的SSH问题导致无法在其他节点启动服务。接下来需要详细分析每个问题。首先，关于SSH的Permission Denied错误。之前用户曾遇到SSH需要输入密码的问题，现在虽然可能已经配置了免密登录，但可能配置不正确，或者权限问题仍然存在。需要检查以下几点： - 各个节点之间的SSH免密登录是否配置正确，包括公钥是否正确分发到authorized_keys文件。 - 文件权限是否正确，如.ssh目录权限是否为700，authorized_keys是否为600。 - 是否所有节点都正确安装了SSH服务，并且sshd_config配置允许公钥认证。其次，主机名解析问题。错误中的“hadoop0i”可能是拼写错误，正确的主机名应该是hadoop01或者其他名称。需要检查Hadoop的配置文件（如workers文件或slaves文件）中的主机名是否正确，确保没有拼写错误。同时，检查/etc/hosts文件或DNS配置，确保所有节点的主机名都能正确解析。然后，JPS输出显示缺少HDFS进程，这是因为start-dfs.sh脚本未能成功启动这些进程。根本原因还是SSH连接失败，导致主节点无法连接到其他节点启动服务。此外，secondary namenode的启动失败也可能是因为主机名错误，导致无法连接到指定的节点。可能的解决方案步骤包括： 1. **修复SSH免密登录问题**： - 检查所有相关节点之间的SSH配置，确保每个节点都能无需密码登录到其他节点。 - 使用ssh-copy-id命令重新分发公钥。 - 验证文件权限是否正确。 - 检查sshd_config配置，确保允许公钥认证。 2. **纠正主机名拼写错误**： - 检查Hadoop的配置文件（如workers文件）中secondary namenode的主机名是否为hadoop0i，如果是拼写错误，修改为正确的主机名，比如hadoop01。 - 检查所有节点的主机名配置，确保/etc/hosts文件包含所有集群节点的正确IP和主机名映射。 3. **验证Hadoop配置**： - 检查core-site.xml、hdfs-site.xml等配置文件，确保名称节点和数据节点的配置正确。 - 确保所有节点的Hadoop安装路径一致，环境变量配置正确。 4. **检查防火墙和SELinux**： - 确认防火墙没有阻止SSH端口（22）和Hadoop相关端口。 - 临时关闭SELinux或设置为permissive模式，以排除其干扰。 5. **重新启动HDFS服务**： - 修复上述问题后，重新运行start-dfs.sh，观察是否还有错误。 - 使用jps检查各个节点上的进程是否正常启动。此外，用户提供的jps输出显示只有ResourceManager和Jps，说明YARN的ResourceManager已经启动，但HDFS的相关进程没有启动，这进一步支持了问题出在SSH和主机名配置上。可能的注意事项： - 用户可能在配置Hadoop集群时，workers文件中包含了hadoop01, hadoop02, hadoop03，但某个节点的主机名配置不正确，或者SSH配置错误。 - Secondary namenode的配置错误可能导致整个HDFS启动失败，需要特别检查该配置项。 - 需要确保所有节点的时间同步，否则可能会导致某些服务无法启动。总结，解决步骤应首先处理SSH免密登录问题，然后纠正主机名配置错误，最后验证Hadoop的配置和启动情况。同时，检查日志文件（如/var/log/secure和Hadoop的日志）可以帮助更准确地定位问题。</think>--- ### **问题分析** 执行 `start-dfs.sh` 时出现的错误可分为三类： 1. **SSH免密登录失败** - 所有节点均报错 `Permission denied (publickey...)`，表明 **SSH公钥认证未生效** 2. **主机名解析错误** - 启动Secondary NameNode时出现 `Could not resolve hostname hadoop0i`，存在 **主机名拼写错误** 3. **HDFS进程未启动** - `jps` 输出中缺少 `NameNode` 和 `DataNode` 进程，说明HDFS未成功启动 --- ### **逐步解决方案** #### **1. 修复SSH免密登录问题** **核心原因** 集群节点间未正确配置SSH免密登录，导致主节点无法通过密钥认证远程启动服务。 **操作步骤** - **(1) 检查所有节点的SSH配置** 在 **每个节点** 上执行： ```bash # 检查公钥是否已分发到所有节点（包括自身） ssh-copy-id root@hadoop01 ssh-copy-id root@hadoop02 ssh-copy-id root@hadoop03 # 验证免密登录是否生效 ssh root@hadoop01 "hostname" # 应直接返回 hadoop01，无需密码 ssh root@hadoop02 "hostname" ssh root@hadoop03 "hostname" ``` - **(2) 检查文件权限（关键！）** ```bash # 在所有节点上执行 chmod 700 ~/.ssh chmod 600 ~/.ssh/authorized_keys chmod 600 ~/.ssh/id_rsa ``` - **(3) 检查SSH服务配置** 在所有节点的 `/etc/ssh/sshd_config` 中确保以下配置： ```ini PubkeyAuthentication yes PasswordAuthentication no # 调试阶段可暂设为 yes ``` 重启SSH服务： ```bash systemctl restart sshd ``` --- #### **2. 修正主机名拼写错误** **错误定位** Secondary NameNode 的启动目标为 `hadoop0i`（末尾字母 `i`），但实际应为数字 `1`（即 `hadoop01`）。 **操作步骤** - **(1) 修改Hadoop配置文件** 检查以下文件中的主机名配置： ```bash # 文件位置：$HADOOP_HOME/etc/hadoop/hdfs-site.xml <property> <name>dfs.namenode.secondary.http-address</name> <value>hadoop01:9868</value> # 确保此处为正确主机名 </property> ``` - **(2) 检查集群主机名映射** 在所有节点的 `/etc/hosts` 中确保包含： ```plaintext 192.168.x.x hadoop01 192.168.x.x hadoop02 192.168.x.x hadoop03 ``` --- #### **3. 验证HDFS启动环境** - **(1) 检查Hadoop配置文件** 确保以下核心配置正确（文件位置：`$HADOOP_HOME/etc/hadoop/`）： - **core-site.xml** ```xml <property> <name>fs.defaultFS</name> <value>hdfs://hadoop01:9000</value> # 指向NameNode地址 </property> ``` - **workers文件** ```plaintext hadoop01 hadoop02 hadoop03 ``` - **(2) 清理临时文件并重新格式化HDFS** ```bash # 停止所有Hadoop进程 stop-dfs.sh # 删除临时数据（所有节点） rm -rf /tmp/hadoop-root/* # 根据实际路径调整 # 重新格式化NameNode（仅在主节点执行） hdfs namenode -format ``` - **(3) 启动HDFS并验证** ```bash start-dfs.sh jps # 应显示 NameNode、DataNode、SecondaryNameNode ``` --- ### **补充排查技巧** 1. **查看Hadoop日志** - NameNode日志：`tail -f $HADOOP_HOME/logs/hadoop-root-namenode-hadoop01.log` - DataNode日志：`tail -f $HADOOP_HOME/logs/hadoop-root-datanode-hadoop01.log` 2. **检查防火墙与端口** ```bash # 开放HDFS端口（所有节点） firewall-cmd --permanent --add-port=9000/tcp # NameNode RPC firewall-cmd --permanent --add-port=9868/tcp # Secondary NameNode firewall-cmd --reload ``` --- ### **典型错误对照表** | 错误现象 | 根本原因 | 解决方案 | |---------|---------|----------| | `Permission denied` | SSH密钥认证失败 | 重新分发公钥并修正权限 | | `Could not resolve hostname` | 主机名拼写错误或DNS未解析 | 检查 `/etc/hosts` 和配置文件 | | 缺少HDFS进程 | NameNode未启动或格式化失败 | 清理临时文件并重新格式化 | 通过上述步骤可系统性解决HDFS启动失败问题，建议按顺序执行并逐项验证。