Hadoop2.x运行模式/部署/区别

本文详细介绍了Hadoop的三种运行模式:单机模式、伪分布模式和完全分布式模式。单机模式适合默认使用,不涉及分布式文件系统;伪分布模式在单机上模拟集群,适合调试和测试;完全分布式模式则是真正的生产环境,需要多台主机搭建,并配置SSH免密码登录。在不同模式下,都需要相应地修改配置文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在做hadoop开发时,理解hadoop的运行模式尤为重要。

 

首先我们了解一下两个目录../hadoop/sbin与../hadoop/etc/hadoop

  • sbin             用于启动hadoop的脚本文件目录
  • etc/hadoop 用于配置启动文件,通过 **.xml 配置来确定hadoop的运行模式

 

 

Hadoop的三种启动模式:

Hadoop部署方式分三种,Standalone mode、Pseudo-Distributed mode、Cluster mode,其中前两种都是在单机部署。

  • 单机模式(Standalone Mode)

    • 默认模式
    • 不对配置文件进行修改
    • 使用本地文件系统,而不是分布式文件系统。
  • 伪分布模式(Pseudo-Distributed Mode)

    • 在一台主机模拟一个小规模的集群,在这种模式下Hadoop使用的是分布式文件系统,一般用于程序调试与测试。也可以说 伪分布式 是 完全分布式 的一个特例。
    • 在这种模式下,Hadoop使用的是分布式文件系统,各个 Job 由 Manager 来管理独立进程。在单机模式之上增加了代码调试功能,允许检查内存使用情况,HDFS输入输出,以及守护进程交互。Hadoop启动NameNode、DataNode、SecondaryNameNode、ResourceManager、NodeManager,这些守护进程都在同一台机器上运行,是相互独立的Java进程。
    • 需要修改配置文件:core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml。配置见下表
    • 格式化文件系统
  • 完全分布式(Cluster Mode)

    • Hadoop的运行在由多台主机搭建的集群上,是真正的生产环境。
    • 在这种模式下,Hadoop在所有的主机上安装JDK、Hadoop、Zookeeper等软件,组成相互连通的网络。
    • 主机间设置SSH免密码登录,把各从节点生成的公钥添加到主节点的信任列表中。
    • 需要修改配置文件:core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml。配置见下表
    • 格式化文件系统。

 

 

xml文件 属性名称本地模式伪分布式完全分布式
core-site.xmlfs.defaultFs (fs.default.name)file:///(默认)hdfs://localhost/hdfs://hadoop1
hdfs-site.xmldfs.replicationN/A13(默认)
mapred-site.xmlmapreduce.framework.namelocal(默认)yarnyarn
yarn-site.xml

yarn.resoucemanager.hostname

yarn.nodemanager.auxservice

N/A

N/A

localhost

mapreduce_shuffle

resoucemanager

maperduce_shuffle

注意:

  • 在本地模式下,使用本地文件系统和本地MapReduce运行。

  • 在分布式模式下,将启动HDFS和YARN守护进程运行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值