简单认识namenode和datanode

一、Hadoop的启动

在阅读这篇博客之前,你应该先阅读:Hadoop的安装与环境搭建.

1. 首先在npdev1机器上面运行hadoop-daemon.sh start namenode,启动namenode.

2. 然后在npfdev2,npfdev3,npfdev4分别运行hadoop-daemon.sh start datanode

3. 启动完成之后,我们的Hadoop的物理架构和逻辑架构如下:

npfdev1机器上面运行namenode, npfdev2,npfdev3,npfdev4分别运行datanode.

4. HDFS架构如下:

Hadoop简单来说就是多台机器备份的,可以横向扩展的系统。

二、使用命令行查看整个集群信息

1. 使用hdfs dfsadmin -report命令

我们为了更好的展示,使用hdfs dfsadmin -report | more 命令:

1.1 看集群的使用情况:

1.2 看集群的datanode的情况,总共有3个live的datanode.

第一个datanode:

第二个datanode:

第三个datanode:

三、使用web页面查看整个集群信息

1. 访问http://npfdev1:50070,选择Overview选项:

2. 选择Datanodes选项:

 3. 选择Utilities选项下面的browse directory,可以看到整个硬盘的使用情况:

4. 选择Utilities选项下面的logs,可以看到启动日志:

四、关闭Hadoop集群

1. 首先在npdev1机器上面运行hadoop-daemon.sh stop namenode.

2. 然后在npfdev2,npfdev3,npfdev4分别运行hadoop-daemon.sh stop datanode.

五、启动和关闭Hadoop集群命令步骤总结:

1. 在master上启动hadoop-daemon.sh start namenode.
2. 在slave上启动hadoop-daemon.sh start datanode.
3. 用jps指令观察执行结果.
4. 用hdfs dfsadmin -report观察集群配置情况.
5. 通过http://npfdev1:50070界面观察集群运行情况.
6. 用hadoop-daemon.sh stop ...手工关闭集群.

Hadoop是一个开源的分布式计算框架,用于处理大规模数据集。它可以在集群上运行,以实现高速数据处理分析。在本文中,我们将介绍如何通过单点式集群式的安装调试来获得对Hadoop的认识。 一、Hadoop单点式安装调试 单点式安装调试是指将Hadoop安装在单个计算机上,以便进行测试开发。 1. 安装Java Hadoop是用Java编写的,因此需要先安装Java。可以从Oracle官网下载Java并按照说明进行安装。 2. 安装Hadoop 可以从Hadoop官网下载Hadoop并按照说明进行安装。安装过程中需要配置一些环境变量,例如JAVA_HOMEHADOOP_HOME。 3. 配置Hadoop 在安装完成后,需要进行一些配置。例如,必须编辑hadoop-env.sh文件以设置JAVA_HOME路径。另外,还需要编辑core-site.xmlhdfs-site.xml文件以配置Hadoop的默认文件系统数据目录。 4. 运行Hadoop 安装配置完成后,可以通过运行start-all.sh脚本启动Hadoop。这将启动Hadoop的各个组件,例如NameNodeDataNodeJobTracker。 5. 进行测试 可以使用Hadoop提供的一些示例程序来测试Hadoop是否正常工作。例如,可以运行WordCount示例程序来计算一个文件中单词的出现次数。 二、Hadoop集群式安装调试 集群式安装调试是指将Hadoop安装在多个计算机上,以便进行分布式计算。 1. 安装Java 与单点式安装调试相同,需要先安装Java。 2. 配置SSH 在集群中,需要使用SSH来进行节点间的通信。因此,需要确保所有节点都可以通过SSH互相访问。可以使用ssh-keygen命令生成公钥私钥,并将公钥分发到所有节点上。 3. 安装Hadoop 在所有节点上都安装Hadoop并按照说明进行配置。与单点式安装调试不同的是,必须确保所有节点上的配置文件都是相同的。 4. 配置Hadoop 在集群中,必须配置Hadoop以使用所有节点。可以编辑hdfs-site.xmlmapred-site.xml文件以指定数据目录JobTracker节点等信息。 5. 运行Hadoop 在所有节点上运行start-all.sh脚本以启动Hadoop。此时,所有节点都将成为集群的一部分,可以进行分布式计算。 6. 进行测试 可以使用Hadoop提供的一些示例程序来测试集群是否正常工作。例如,可以运行WordCount示例程序来计算多个文件中单词的出现次数。 总结 无论是单点式还是集群式安装调试,都需要按照Hadoop官方文档进行操作。通过这些操作,可以获得对Hadoop的基本认识,并开始进行大规模数据处理分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值