hadoop docker安装部署

本文详细介绍了如何在Docker环境下安装部署Hadoop,包括前置条件(需要JDK镜像和Hadoop安装包)、解压安装包、修改配置文件(如hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml),以及格式化namenode和启动namenode/datanode的过程。通过这些步骤,读者将能够理解如何在容器中搭建和运行Hadoop集群。
前置条件

1.jdk镜像
2.hadoop安装包

解压安装包
tar -zxvf cenos-6.5-hadoop-2.6.4.tar.gz -C /usr/local
cd /usr/local
mv hadoop-2.6.4 hadoop
修改配置文件:
cd hadoop/etc/hadoop

1.首先修改hadoop-env.sh


                
### 安装部署Hadoop单节点集群于Docker #### 创建自定义Dockerfile 为了在Docker容器内安装并配置Hadoop单节点环境,创建一个名为`Dockerfile`的文件来指定所需的操作系统基础镜像以及一系列用于设置该环境的指令。 ```dockerfile FROM ubuntu:latest # 设置工作目录 WORKDIR /usr/local/ # 更新包列表并且安装必要的软件包 RUN apt-get update && \ apt-get install -y openjdk-8-jdk wget ssh rsync vim && \ rm -rf /var/lib/apt/lists/* # 下载并解压Hadoop分发版本至特定位置 ENV HADOOP_VERSION=3.3.0 RUN wget https://archive.apache.org/dist/hadoop/core/hadoop-$HADOOP_VERSION/hadoop-$HADOOP_VERSION.tar.gz && \ tar xvzf hadoop-$HADOOP_VERSION.tar.gz && \ mv hadoop-$HADOOP_VERSION/ hadoop && \ rm hadoop-$HADOOP_VERSION.tar.gz # 配置环境变量以便命令行工具能够找到Hadoop二进制文件 ENV PATH=$PATH:/usr/local/hadoop/bin/:/usr/local/hadoop/sbin/ ENV HADOOP_HOME=/usr/local/hadoop ENV HADOOP_MAPRED_HOME=${HADOOP_HOME} ENV HADOOP_COMMON_HOME=${HADOOP_HOME} ENV HADOOP_HDFS_HOME=${HADOOP_HOME} ENV YARN_HOME=${HADOOP_HOME} # 修改核心站点配置以适应伪分布式模式下的操作需求 COPY core-site.xml ${HADOOP_HOME}/etc/hadoop/core-site.xml # 调整YARN框架名称属性确保MapReduce作业提交给本地ResourceManager实例处理 COPY yarn-site.xml ${HADOOP_HOME}/etc/hadoop/yarn-site.xml # 启动SSH服务允许内部通信机制正常运作 EXPOSE 22 CMD service ssh start && bash ``` 上述脚本中的`core-site.xml`与`yarn-site.xml`应被预先准备好,并放置在同一路径下供构建过程复制到适当的位置。对于`core-site.xml`, 只需简单地指明临时存储地址即可;而针对`yarn-site.xml`则要特别注意设定`mapreduce.framework.name=yarn`这一项[^3]。 #### 构建Docker镜像 完成Dockerfile编写之后,在同一目录执行如下命令来进行镜像编译: ```bash docker build -t my-hadoop . ``` 这一步骤会读取当前目录里的Dockerfile按照指示逐步组装成一个新的Docker镜像标签为`my-hadoop`. #### 运行容器启动Hadoop服务 利用刚刚建立好的镜像开启新的交互式shell session: ```bash docker run -it --name=hadoop-container my-hadoop ``` 进入容器后继续初始化namenode元数据结构并格式化它: ```bash hdfs namenode -format ``` 最后依次激活NameNode、DataNode、ResourceManager还有NodeManager组件: ```bash start-dfs.sh start-yarn.sh mr-jobhistory-daemon.sh start historyserver ``` 此时便成功搭建起了基于Docker容器技术实现的一个简易版Hadoop单节点实验平台[^1][^2].
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值