在docker的centos官方镜像中安装hadoop的一些关键步骤

本文详细介绍了如何在CentOS 6.7环境中搭建Hadoop集群,包括使用Docker快速部署CentOS镜像,安装并配置Java环境,以及具体步骤来修改Hadoop配置文件等内容。

在docker中使用
$ docker pull centos:centos6.7
拉去centos6.7镜像,拉完后直接用 docker create命令创建容器。
很慢?可以用阿里云加速

1. JAVA环境

安装java openjdk 1.8

$ yum install java-1.8.0-openjdk

查看jdk安装位置

$ rpm -ql java-1.8.0-openjdk

我的是在/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.141-3.b16.el6_9.x86_64 这个位置,而且这个目录下只有一个jre文件夹

1.1 配置JAVA环境变量

建议配到用户环境信息里去
先打开自己的用户环境信息配置文件

$ source ~/.bash_profile

再使用下述命令查看是否配置成功,如果没有输出任何内容,则表示配置有问题

$ echo $JAVA_HOME

二、修改Hadoop的配置文件

1. hadoop-env.sh、yarn-env.sh

初始的hadoop-env.sh文件内容如下,有一行为

...
export JAVA_HOME=${JAVA_HOME}
...

这样是不行的,要修改为绝对路径

...
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.141-3.b16.el6_9.x86_64
...

而在yarn-env.sh中,export JAVA_HOME 是被注释掉的,所以需要将前面的#号去掉,再写成上面的样子

2. core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml

请根据自己使用的需求,是单机还是分布式进行百度搜索

3. hdfs

因为使用的是openjdk,所以需要将这个文件修改一下,不然会报找不到java程序的错误。
对于hdfs(在bin目录下)脚本,需要修改JAVA变量,来使得它能找到java程序

...
else
    # run it
    JAVA=$JAVA_HOME/jre/bin/java #指定java程序
    exec "$JAVA" -Dproc_$COMMAND $JAVA_HEAP_MAX $HADOOP_OPTS $CLASS "$@"
fi

如果在运行start-all.sh时也报未找到java程序的错误,只需根据错误提示找到相应的脚本,添加上述代码即可。

CentOS中通过Docker安装Hadoop是一个相对简单且高效的方法。以下是详细的步骤: ### 1. 安装Docker 首先,确保你的CentOS系统已经安装Docker。如果还没有安装,可以使用以下命令进行安装: ```bash sudo yum update -y sudo yum install -y docker sudo systemctl start docker sudo systemctl enable docker ``` ### 2. 拉取Hadoop镜像 接下来,拉取一个已经配置好的Hadoop Docker镜像。你可以使用官方Hadoop镜像,或者选择一个社区维护的镜像。这里以官方镜像为例: ```bash docker pull sequenceiq/hadoop-docker:2.7.1 ``` ### 3. 运行Hadoop容器 拉取完成后,运行Hadoop容器: ```bash docker run -it sequenceiq/hadoop-docker:2.7.1 /etc/bootstrap.sh -bash ``` ### 4. 验证Hadoop安装 进入容器后,可以通过以下命令验证Hadoop是否安装成功: ```bash hadoop version ``` 如果输出类似以下的版本信息,说明安装成功: ``` Hadoop 2.7.1 Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -06-29T06:04Z Compiled with protoc 2.5.0 From source with checksum d0fda26633fa762bff87ec759ebe689c This command was run using /usr/local/hadoop-2.7.1/share/hadoop/common/hadoop-common-2.7.1.jar ``` ### 5. 访问Hadoop Web界面 Hadoop的Web界面默认运行在50070端口。你可以通过以下命令获取容器的IP地址,然后通过浏览器访问: ```bash docker inspect --format='{{.NetworkSettings.IPAddress}}' <container_id> ``` 然后在浏览器中访问 `http://<container_ip>:50070`。 ### 6. 配置Hadoop 如果需要自定义Hadoop的配置,可以挂载本地配置文件到容器中。例如: ```bash docker run -it -v /path/to/local/config:/usr/local/hadoop/etc/hadoop sequenceiq/hadoop-docker:2.7.1 /etc/bootstrap.sh -bash ``` 这样,你可以在本地编辑配置文件,然后在容器中生效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值