(大数据方向)分布式实验二:搭建完全分布式

本文详细介绍了如何在多台虚拟机上搭建Hadoop的完全分布式环境,包括克隆虚拟机、网络配置、时间同步、主机名更改、免密钥登陆、Hadoop配置等步骤,最终实现通过Web查看分布式系统状态。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  前言:

        这篇博客时基础的完全分布式搭建,并没有采用高可用搭建,下一篇会专门写采用简单的高可用搭建的步骤,如果有错,希望大家及时指正,谢谢各位啦

目录

分布式相关概念:

(1)什么是分布式文件系统:

(2)分布式文件系统的结构:

(3)主,从节点各自的职责:

 (4)大致物理结构图:

Hadoop 完全分布式搭建

搭建需知

第一步:拍摄快照并克隆虚拟机

 第二步:对这四台虚拟机进行网络配置

 第三步:同步时间并更改四台虚拟机的主机名

 第四步:设置免密钥登陆

 第五步:hadoop配置

(1)core-site.xml

(2)hdfs-site.xml

(3)slaves

 (4)传输文件

(5)格式化

(6)启动

 第六步:通过web查看



分布式相关概念:

(1)什么是分布式文件系统:

        分布式文件系统:通过网络实现文件在多台主机上进行分布式存储的文件系统

         1.分布式系统一定是由多个节点组成的系统。其中,节点指的是计算机服务器,而且这些节点一般不是孤立的,而是互通的。

        2.这些连通的节点上部署了我们的节点,并且相互的操作会有协同。   

(2)分布式文件系统的结构:

分布式文件系统在物理结构上是由计算机集群的多个节点构成的。

一般来说分为两类:1.主节点(Master Node)或者叫做“名称节点”(NameNode)

                                 2.从节点(Slave Node) 或者叫做“数据节点”(DataNode)

(3)主,从节点各自的职责:

主节点(名称节点):①负责文件,目录的创建,删除,重命名等操作;

                                    ②管理数据节点和文件快的映射关系

导致--->客户端只有访问名称节点,才能找到请求的文件块所在的位置,

             进而到相应位置读取所需文件快。

从节点(数据节点):①负责数据的存储和读取操作;

存储时:由名称节点分配存储位置——>由客户端把数据直接写入相应的数据节点

读取时:客户端从名称节点获得 数据节点和文件块的映射关系——>即可到相应位置访问文件块。

                                    ②根据名称节点的命令创建删除和复制数据块。

 (4)大致物理结构图:

Hadoop 完全分布式搭建

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Java从跨平台到跨行业

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值