大数据基础平台实施及运维之伪分布式部署

本文详细介绍了Hadoop伪分布式部署的全过程,包括修改配置文件如hadoop-env.sh、mapred-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml,启动NameNode、DataNode,配置并运行YARN,以及HDFS上的操作测试。通过YARN理解资源管理和任务调度,并体验WordCount实例,最后讨论了日志聚集和历史服务的开启。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习目标:

 能够了解伪分布式部署模式

 能够正确修改配置文件

 能够掌握YARN架构及架构角色功能

 能够对已部署的Hadoop集群进行应用测试

1)伪分布式部署模式介绍

  Hadoop守护进程运行在本地机器上,模拟一个小规模的的集群。

 该模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS输入/输出,以及其他的守护进程交互。

2)获取软件包

可参考:第八节 1.2.11.2.2小节

3)修改配置文件

主要涉及的配置文件有:hadoop-env.shmapred-env.shyarn-env.shcore-site.xml

3.1)修改hadoop-env.shmapred-env.shyarn-env.sh文件中JAVA_HOME参数

1[root@localhost ~]#vim ${HADOOP_HOME}/etc/hadoop/hadoop-env.sh
1修改JAVA_HOME参数为:
2export JAVA_HOME="/usr/local/jdk"

3.2)修改core-site.xml

[root@localhost ~]#vim ${HADOOP_HOME}/etc/hadoop/core-site.xml
(1)配置fs.defaultFS
<property>
 <name>fs.defaultFS</name>
 <value>hdfs://hd1:8020</value>
</property>
(2)配置hadoop临时目录
 <property>
  <name>hadoop.tmp.dir</name>
  <value>/opt/data/tmp</value>
 </property>
    

配置临时目录前,请先创建此目录,不创建也可以。

HDFSNameNode数据默认都存放这个目录下,查看 *-default.xml 等默认配置文件,就可以看到很多依赖${hadoop.tmp.dir} 的配置。

默认的 hadoop.tmp.dir  /tmp/hadoop-${user.name} ,此时有个问题就是NameNode会将HDFS的元数据存

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐小秃头

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值