Hadoop+Zookeeper+Hbase集群搭建-优快云博客

本文链接：https://blog.youkuaiyun.com/hehehechen/article/details/106211023

本文详细介绍了一种Hadoop+Zookeeper+Hbase集群的搭建过程，包括三台服务器的环境配置、JDK安装、Zookeeper、Hadoop和Hbase的安装与配置步骤，以及异常处理方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hbase集群

Hadoop + zookeeper +hbase 总共三台

Hadoop	10.75.3.15/16/17	Rhel7
Zookeeper	10.75.3.15/16/17	Rhel7
Hbase	10.75.3.15/16/17	Rhel7

一安装JDK

配置JDK环境

修改系统JDK版本/etc/profile

export JAVA_HOME=/opt/java/jdk1.8.0_162

export JAVA_BIN=/opt/java/jdk1.8.0_162/bin

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME JAVA_BIN PATH CLASSPATH

二、Zookeeper安装

1、安装三台

配置hosts解析(这里hadoop配置以及配置了)

解压zookeeper至/app/Hadoop/下

2、修改住配置文件

cd /app/hadoop/zookeeper-3.4.6/conf

mv zoo_sample.cfg zoo.cfg

在配置文件中添加 zk

dataDir=/app/hadoop/zookeeper-3.4.6/data 存储数据地址也就是myid存放地址

dataLogDir=/app/hadoop/zookeeper-3.4.6/logs log日志存放目录

server.1=server1:2888:3888 这里server可以换成ip也行

server.2=server2:2888:3888

server.3=server3:2888:3888

echo “1” > /app/hadoop/zookeeper-3.4.6/data/myid 这里myid三台都需要修改但不能相同

解压后吧文件拷贝至server2级server3就行

三、安装hadoop

1、三台都需要修改主机名及ssh免密

hostnamectl set-hostsname server1

hostnamectl set-hostsname server2

hostnamectl set-hostsname server3

vim /etc/hosts

10.75.3.15 server1

10.75.3.16 server2

10.75.3.17 server3

配置ssh免密

ssh-keygen 后回车

ssh-copy-id server1:

ssh-copy-id server2:

ssh-copy-id server3:

这里需要手动登陆第一次

如果不想用命令就手工拷贝每台主机的id_rsa.pub内容至authorized_keys文件中

2、安装hadoop

mkdir /app/Hadoop/

下载hadoop包至该目录

tar xvf hadoop-2.5.1.tar.gz

修改hadoop配置文件

cd /app/hadoop/hadoop/etc/Hadoop

配置jdk vim hadoop-env.sh

export JAVA_HOME=/opt/java/jdk1.8.0_191

配置core vim core-site.xml

<name>fs.default.name</name>

<value>hdfs://server1:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/app/hadoop/hadoop/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

</configuration>

第一项指定文件系统为 server 1节点 9000 端口上的 HDFS，第二项指定 hadoop 所有数据的保存路径（该路径要存在），该项默为/tmp/hadoop-{username}，系统重启可能会导致数据丢失。

配置mapred vim mapred-site.xml

<name>mapred.job.tracker</name>

<value>server1:9001</value>

</property>

<name>mapred.map.java.opts</name>

</property>

<name>mapred.child.java.opts</name>

</property>

</configuration>

第一项指定 JobTracker 的服务端口为 node0 的 9001 端口，第二、三项设定 jvm 堆空间，防止运行 Map-Reduce 作业时出现内存不足，这两项要根据实际的需要和系统空闲的内存容量设定

配置hdfs vim hdfs-site.xml

<name>dfs.replication</name>

</property>

<name>dfs.support.append</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.datanode.max.xcievers</name>

</property>

</configuration>

第一项设定了文件系统备份的个数，通常为 3，第二项允许对文件的 append 操作，是为 HBase 设置的，第三项关闭权限检查，方便以后的远程的 hadoop-eclipse 插件访问 hdfs，第四项设置 DataNode 同时可供访问的文件数上限，由于 HBase 需要同时操作大量的文件，该项至少要设置为 4096