Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.yarn.exceptions.YarnRuntimeException

博主在学习Hadoop时遇到了运行WordCount程序报ClassNotFoundException的问题,检查发现是配置文件yarn-site.xml和mapred-site.xml的问题。经过调整yarn.application.classpath和mapreduce.application.classpath的配置,添加了Hadoop相关目录,问题得以解决。建议遇到相同问题的学习者对比配置进行排查。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

日志报错内容:Caused by:java.lang.ClassNotFoundException:org.apache.hadoop.yarn.exceptions.YarnRuntimeException at java.net.URLClassLoader.findClass(URLClassLoader.java:382) at java.lang.ClassLoader.loadClass(ClassLoader.java:424) at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
at java.lang.ClassLoader.loadClass(ClassLoader.java:357) … 7 more

本人初学hadoop,是按照尚硅谷的b站视频学习,也是按照尚硅谷的配置文档配置的yarn-site.sml等等,但是到我运行wordcount就报错。现把我修改的地方大家可以在做个对比(仅针对我修改的文档做对比,未修改的地方就按照尚硅谷的资料来配置)。

此处为尚硅谷的配置文档

1:yarn-site.xml

		                                            <configuration>
													 <!-- 指定 MR 走 shuffle -->
													 <property>
													 <name>yarn.nodemanager.aux-services</name>
													 <value>mapreduce_shuffle</value>
													 </property>
													 <!-- 指定 ResourceManager 的地址-->
													 <property>
													 <name>yarn.resourcemanager.hostname</name>
													 <value>hadoop103</value>
													 </property>
													 <!-- 环境变量的继承 -->
													 <property>
													 <name>yarn.nodemanager.env-whitelist</name>
													 
													<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
													NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
													RED_HOME</value>
													 </property>
													
													<!-- 开启日志聚集功能 -->
													<property>
													 <name>yarn.log-aggregation-enable</name>
													 <value>true</value>
													</property>
													<!-- 设置日志聚集服务器地址 -->
													<property> 
													 <name>yarn.log.server.url</name> 
													 <value>http://hadoop102:19888/jobhistory/logs</value>
													</property>
													<!-- 设置日志保留时间为 7 天 -->
													<property>
													 <name>yarn.log-aggregation.retain-seconds</name>
													 <value>604800</value>
													</property>
													</configuration>

2:mapred-site.xml

											           <!-- 历史服务器端地址 -->
														<property>
														 <name>mapreduce.jobhistory.address</name>
														 <value>hadoop102:10020</value>
														</property>
														<!-- 历史服务器 web 端地址 -->
														<property>
														 <name>mapreduce.jobhistory.webapp.address</name>
														 <value>hadoop102:19888</value>
														</property>
自行修改的地方

1:yarn-site.xml

<configuration>
<!-- 指定 MR 走 shuffle -->
<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>
<!-- 指定 ResourceManager 的地址-->
<property>
	<name>yarn.resourcemanager.hostname</name>
	<value>hadoop103</value>
</property>
<!-- 环境变量的继承 -->
<property>
<name>yarn.nodemanager.env-whitelist</name>
	<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,
	CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>													
<property>
	<name>yarn.application.classpath</name>
<value>
	$HADOOP_CONF_DIR,
	$HADOOP_COMMON_HOME/share/hadoop/common/*,
	$HADOOP_COMMON_HOME/share/hadoop/common/lib/*,
	$HADOOP_HDFS_HOME/share/hadoop/hdfs/*,
	$HADOOP_HDFS_HOME/share/hadoop/hdfs/lib/*,
	$YARN_HOME/share/hadoop/yarn/*
	$YARN_HOME/share/hadoop/yarn/lib/*
	$YARN_HOME/share/hadoop/mapreduce/*,
	$YARN_HOME/share/hadoop/mapreduce/lib/*
	export HADOOP_MAPRED_HOME=$HADOOP_HOME
	export HADOOP_COMMON_HOME=$HADOOP_HOME
	export HADOOP_HDFS_HOME=$HADOOP_HOME
	export YARN_HOME=$HADOOP_HOME
	export HADOOP_YARN_HOME=$HADOOP_HOME
	export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
	export HDFS_CONF_DIR=$HADOOP_HOME/etc/hadoop
	export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
     </value>
</property>														
<property>
	<name>yarn.application.classpath</name>
<value>
	/opt/module/hadoop-3.1.3/etc/*,        
	/opt/module/hadoop-3.1.3/etc/hadoop/*,
	/opt/module/hadoop-3.1.3/lib/*,
	/opt/module/hadoop-3.1.3/share/hadoop/common/*,
	/opt/module/hadoop-3.1.3/share/hadoop/common/lib/*,
	/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/*,
	/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/lib-examples/*,
	/opt/module/hadoop-3.1.3/share/hadoop/hdfs/*,
	/opt/module/hadoop-3.1.3/share/hadoop/hdfs/lib/*,
	/opt/module/hadoop-3.1.3/share/hadoop/yarn/*,
	/opt/module/hadoop-3.1.3/share/hadoop/yarn/lib/*
     </value>
</property>															
<!-- 开启日志聚集功能 -->
<property>
	<name>yarn.log-aggregation-enable</name>
	<value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property> 
	<name>yarn.log.server.url</name> 
	<value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为 7 天 -->
<property>
	<name>yarn.log-aggregation.retain-seconds</name>
	<value>604800</value>
</property>
</configuration>

2:marped-site.xml

<configuration>
<!-- 指定 MapReduce 程序运行在 Yarn 上 -->
<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>
<property>
	<name>yarn.app.mapreduce.am.env</name>
	<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property> 
														           
<property>
<name>mapreduce.application.classpath</name>
       <value> 
	/opt/module/hadoop-3.1.3/etc/*,
	/opt/module/hadoop-3.1.3/etc/hadoop/*,
	/opt/module/hadoop-3.1.3/lib/*, 
	/opt/module/hadoop-3.1.3/share/hadoop/common/*,
	/opt/module/hadoop-3.1.3/share/hadoop/common/lib/*,
	/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/*,
	/opt/module/hadoop-3.1.3/share/hadoop/mapreduce/lib-examples/*,
	/opt/module/hadoop-3.1.3/share/hadoop/hdfs/*,
	/opt/module/hadoop-3.1.3/share/hadoop/hdfs/lib/*,
	/opt/module/hadoop-3.1.3/share/hadoop/yarn/*,
	/opt/module/hadoop-3.1.3/share/hadoop/yarn/lib/*,x
       </value>
</property>
<!-- 历史服务器端地址 -->
<property>
	<name>mapreduce.jobhistory.address</name>
	<value>hadoop102:10020</value>
	</property>
<!-- 历史服务器 web 端地址 -->
<property>
	<name>mapreduce.jobhistory.webapp.address</name>
	<value>hadoop102:19888</value>
</property>
</configuration>

遇到同样问题的童鞋可以试一下,具体原因我也不懂。

2025-03-30 22:26:59,385 INFO impl.MetricsSystemImpl: Stopping NodeManager metrics system...2025-03-30 22:26:59,387 INFO impl.MetricsSystemImpl: NodeManager metrics system stopped. 2025-03-30 22:26:59,387 INFO impl.MetricsSystemImpl: NodeManager metrics system shutdown complete.2025-03-30 22:26:59,388 ERROR nodemanager.NodeManager: Error starting NodeManager org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.net.BindException: Problem binding to [0.0.0.0:8040]java.net.BindException: Address already in use: bind; For more details see: http://wiki.apache.o rg/hadoop/BindException at org.apache.hadoop.yarn.factories.impl.pb.RpcServerFactoryPBImpl.getServer(RpcServerFactoryPBImpl.java:138) at org.apache.hadoop.yarn.ipc.HadoopYarnProtoRPC.getServer(HadoopYarnProtoRPC.java:65) at org.apache.hadoop.yarn.ipc.YarnRPC.getServer(YarnRPC.java:54) at org.apache.hadoop.yarn.server.nodemanager.containermanager.localizer.ResourceLocalizationService.createServer(ResourceLocalizationService.java:409) at org.apache.hadoop.yarn.server.nodemanager.containermanager.localizer.ResourceLocalizationService.serviceStart(ResourceLocalizationService.java:385) at org.apache.hadoop.service.AbstractService.start(AbstractService.java:194) at org.apache.hadoop.service.CompositeService.serviceStart(CompositeService.java:121) at org.apache.hadoop.yarn.server.nodemanager.containermanager.ContainerManagerImpl.serviceStart(ContainerManagerImpl.java:668) at org.apache.hadoop.service.AbstractService.start(AbstractService.java:194) at org.apache.hadoop.service.CompositeService.serviceStart(CompositeService.java:121) at org.apache.hadoop.service.AbstractService.start(AbstractService.java:194) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.initAndStartNodeManager(NodeManager.java:978) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.main(NodeManager.java:1057) Caused by: java.net.BindException: Problem binding to [0.0.0.0:8040] java.net.BindException: Address already in use: bind; For more details see:http://wiki.apache.org/hadoop/BindException at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62) at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) at java.lang.reflect.Constructor.newInstance(Constructor.java:423) at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:836) at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:741)
03-31
<think>嗯,用户提供的日志显示在启动Hadoop YARN的NodeManager时遇到了错误。首先,我需要理解这些日志的结构和内容。错误信息的关键部分是“BindException: Address already in use: bind”,这意味着端口8040被占用了。用户可能需要知道为什么这个端口被占用,以及如何解决这个问题。 首先,我应该确认8040端口的作用。在Hadoop中,NodeManager的端口8040用于节点的本地化资源和任务管理。如果这个端口被其他进程占用,NodeManager就无法启动。接下来,用户需要检查哪个进程占用了该端口,并终止它,或者更改NodeManager的配置使用其他端口。 然后,我需要考虑不同的操作系统下如何查找占用端口的进程。比如,在Linux上可以用`netstat`或`lsof`,而Windows则用`netstat -ano`。用户可能需要具体的命令示例。 另外,用户可能还想知道如何避免这种情况再次发生,比如确保在启动服务前检查端口,或者配置Hadoop使用不同的端口。还可能涉及到修改配置文件如yarn-site.xml,调整相应的参数如`yarn.nodemanager.address`。 需要注意的是,用户可能对Hadoop的配置不熟悉,所以步骤要详细,并提供具体的配置项名称和可能的路径。此外,如果用户是新手,可能需要解释如何编辑配置文件以及重启服务。 此外,错误日志中的其他信息,比如Metrics系统的停止和启动顺序,可能也需要注意是否存在其他潜在问题,但主要问题显然是端口冲突。因此,解决方案应集中在解决端口占用问题上。 最后,确保回答结构清晰,分步骤说明,并验证解决方案的有效性,比如建议用户终止进程后再次启动NodeManager,并确认服务运行正常。</think>您提供的日志显示了Hadoop YARN NodeManager启动失败的过程。我们逐步分析问题根源及解决方案: --- ### **关键错误定位** 日志核心错误为: ```log ERROR nodemanager.NodeManager: Error starting NodeManager org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.net.BindException: Problem binding to [0.0.0.0:8040] Address already in use ``` ### **分步诊断与解决** #### 1. 端口冲突确认 - **端口作用**:NodeManager通过`8040`端口提供资源本地化服务(ResourceLocalizationService) - **冲突原因**:系统中已有进程占用了`0.0.0.0:8040`(即所有网络接口的8040端口) #### 2. 查找占用进程 **Linux/Mac系统**: ```bash lsof -i :8040 # 查看占用进程PID # 或 netstat -tulpn | grep :8040 ``` **Windows系统**: ```powershell netstat -ano | findstr :8040 # 获取PID后通过任务管理器终止 ``` #### 3. 释放端口方式 - **终止占用进程**:`kill -9 <PID>`(Linux/Mac)或通过任务管理器(Windows) - **修改NodeManager配置**(若需保留现有进程): 编辑`yarn-site.xml`,添加: ```xml <property> <name>yarn.nodemanager.address</name> <value>0.0.0.0:自定义端口号</value> <!-- 如8041 --> </property> ``` #### 4. 验证修复 重启NodeManager并检查日志: ```bash yarn --daemon start nodemanager # Hadoop 2.x # 或 hadoop-daemon.sh start nodemanager # Hadoop 1.x ``` --- ### **日志时序分析** 1. **指标系统关闭**: ```log INFO impl.MetricsSystemImpl: Stopping NodeManager metrics system... INFO impl.MetricsSystemImpl: NodeManager metrics system shutdown complete. ``` - 正常关闭监控指标系统,非错误根源 2. **服务启动时序问题**: - 容器管理器(ContainerManagerImpl)启动依赖资源本地化服务 - 端口冲突导致资源本地化服务初始化失败,引发级联故障 --- ### **预防措施** 1. **端口预检脚本**: ```bash #!/bin/bash if lsof -i :8040 > /dev/null; then echo "端口8040已被占用!" exit 1 fi ``` 2. **配置隔离策略**: ```xml <!-- conf/yarn-site.xml --> <property> <name>yarn.nodemanager.localizer.address</name> <value>0.0.0.0:8041</value> </property> ``` --- ### **技术原理延伸** - **绑定地址`0.0.0.0`**:表示监听所有网络接口,包括本地环回(127.0.0.1)和物理网卡IP - **Hadoop RPC机制**:使用Protocol Buffers实现跨节点通信,端口冲突会导致RPC服务初始化失败 - **YARN组件依赖树**: ```mermaid graph TD NodeManager --> ContainerManager ContainerManager --> ResourceLocalizationService ResourceLocalizationService --> RPC_Server(8040端口) ``` 建议通过`jps`命令确认Hadoop组件状态,确保无重复启动的服务实例。此类型端口冲突问题在分布式系统中常见,完善的端口管理方案能显著降低故障率。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值