（大数据方向）分布式实验二：搭建完全分布式

原创

已于 2022-03-22 20:12:31 修改 · 2.7k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hadoop #分布式 #java

于 2022-03-21 00:08:51 首次发布

本文详细介绍了如何在多台虚拟机上搭建Hadoop的完全分布式环境，包括克隆虚拟机、网络配置、时间同步、主机名更改、免密钥登陆、Hadoop配置等步骤，最终实现通过Web查看分布式系统状态。

前言：

这篇博客时基础的完全分布式搭建，并没有采用高可用搭建，下一篇会专门写采用简单的高可用搭建的步骤，如果有错，希望大家及时指正，谢谢各位啦

目录

分布式相关概念：

（1）什么是分布式文件系统：

（2）分布式文件系统的结构：

（3）主，从节点各自的职责：

（4）大致物理结构图：

Hadoop 完全分布式搭建

第一步：拍摄快照并克隆虚拟机

第二步：对这四台虚拟机进行网络配置

第三步：同步时间并更改四台虚拟机的主机名

第四步：设置免密钥登陆

第五步：hadoop配置

（1）core-site.xml

（2）hdfs-site.xml

（4）传输文件

（5）格式化

第六步：通过web查看

分布式相关概念：

（1）什么是分布式文件系统：

        分布式文件系统：通过网络实现文件在多台主机上进行分布式存储的文件系统

         1.分布式系统一定是由多个节点组成的系统。其中，节点指的是计算机服务器，而且这些节点一般不是孤立的，而是互通的。

        2.这些连通的节点上部署了我们的节点，并且相互的操作会有协同。

（2）分布式文件系统的结构：

分布式文件系统在物理结构上是由计算机集群的多个节点构成的。

一般来说分为两类：1.主节点（Master Node）或者叫做“名称节点”（NameNode）

2.从节点（Slave Node）或者叫做“数据节点”（DataNode）

（3）主，从节点各自的职责：

主节点（名称节点）：①负责文件，目录的创建，删除，重命名等操作；

②管理数据节点和文件快的映射关系

导致--->客户端只有访问名称节点，才能找到请求的文件块所在的位置，

进而到相应位置读取所需文件快。

从节点（数据节点）：①负责数据的存储和读取操作；

存储时：由名称节点分配存储位置——>由客户端把数据直接写入相应的数据节点

读取时：客户端从名称节点获得数据节点和文件块的映射关系——>即可到相应位置访问文件块。

②根据名称节点的命令创建删除和复制数据块。

（4）大致物理结构图：

Hadoop 完全分布式搭建

搭建需知

此处的完全分布式搭建是基于博主上一篇博客（伪分布式搭建）的基础上进行的搭建，会省略克隆虚拟机后JDK下载，环境变量配置，hadoop-2.6.5的安装配置的相关步骤，详情请参考上篇博客：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Java从跨平台到跨行业 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。