Hadoop----伪分布式集群搭建

本文详细介绍了如何在单台主机上搭建Hadoop伪分布式集群,包括上传和配置Hadoop与JDK压缩包,创建文件夹软链接,配置环境变量,修改相关配置文件,设置SSH无密码登录,格式化分布式文件系统,启动守护进程,以及进行MapReduce作业的测试。通过这些步骤,可以在本地模拟多节点集群环境进行Hadoop操作和应用测试。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

定义

Hadoop伪分布式集群(pseudo distributed cluster),就是在一台主机上模拟多个主机(数据存储节点)。即hadoop的守护程序在本地计算机(这个指的是Linux虚拟机)上运行,模拟集群环境,并且是相互独立的Java进程。

在这种模式下,Hadoop使用的是分布式文件系统,各个作业也是由ResourceManager服务来管理的独立进程。

比单节点集群(local mode) 多了代码调试功能,允许检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。

伪分布式集群搭建

  1. 上传jdk和hadoop压缩包
    找到虚拟机,右击选择“设置”,点击“选项”----“共享文件夹”
    在这里插入图片描述
    选择“总是启用”,点击添加按钮
    在这里插入图片描述
    点击浏览,选择Windows下的存放hadoop-2.7.3.tar.gz和
    jdk-8u172-linux-x64.tar.gz的文件夹,点击确定。在这里插入图片描述
    打开虚拟机,查看根目录下的mnt文件夹下的hgfs文件夹,可看到:通过上一步操作设置的共享文件,可通过虚拟机查询使用
    在这里插入图片描述
    进入文件夹,查看文件,
    在这里插入图片描述
    在用户目录下创建文件夹apps,将/mnt/hgfs/Hadoop下的压缩包文件,拷贝到apps下
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值