Hadoop0.23配置

最新推荐文章于 2025-12-11 13:08:50 发布

转载最新推荐文章于 2025-12-11 13:08:50 发布 · 1.9k 阅读

文章标签：

#hadoop #java #log4j #集群 #脚本 #path

linux 专栏收录该内容

4 篇文章

订阅专栏

使用hadoop-0.23 搭建hdfs, namenode + datanode

1.HDFS-1052引入了多namenode, HDFS架构变化较大,可以参考hortonworks的文章:http://hortonworks.com/an-introduction-to-hdfs-federation/.

我将在接下来的博客里把此文章翻译一下(另外还有: http://developer.yahoo.com/blogs/hadoop/posts/2011/03/mapreduce-nextgen-scheduler/).

所有namenode共享datanode,各个namenode相互独立,互不影响,每个namenode都有一个backupNode和SecondaryNamenode,提供主备切换功能和备份元数据的功能.

下文的配置信息主要参考HDFS-2471.

2.环境:

a)五台机器 ,linux系统,

b)互相添加ssh-key,后应该可以不用密码互连

c)编译好的0.23版本的包: hadoop-0.23.0-SNAPSHOT.tar.gz

d)每台机器需要安装java1.6或以上版本.并把JAVA_HOME加到$PATH中.

e)最好加上pssh和pscp工具.

这里把五台机器命名为:

Myhost1

Myhost2

Myhost3

Myhost4

Myhost5

假设我们需要搭建如下集群:

Myhost1和Myhost2开启 namenode,另外三台机器启动datanode服务.

3.首先把分配到五台机器上,然后解压.(推荐使用pscp, pssh命令)

4.然后在五台机器上安装java,并把JAVA_HOME加到$PATH中

5.进入解压后的hadoop目录,编辑 etc/hadoop/hdfs-site.xml

a)Myhost1的配置如下(其中hadoop存放在/home/yuling.sh/目录下):

<property>
<name>fs.defaultFS</name>
<value>hdfs:// Myhost1:9000</value>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>/home/yuling.sh/cluster-data</value>
</property>

b)Myhost2的配置如下(其中hadoop存放在/home/yuling.sh/目录下):

<property>
<name>fs.defaultFS</name>
<value>hdfs:// Myhost2:9000</value>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>/home/yuling.sh/cluster-data</value>
</property>

c) 这里把Myhost1集群起名ns1, Myhost1集群起名ns2,三台slava的etc/hadoop/hdfs-site.xml配置如下:

<property>
<name>dfs.federation.nameservices</name>
<value>ns1,ns2</value>
</property>

<property>
<name>dfs.namenode.rpc-address.ns1</name>
<value>hdfs:// Myhost1:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.ns1</name>
<value> Myhost1:50070</value>
</property>

<property>
<name>dfs.namenode.rpc-address.ns2</name>
<value>hdfs:// Myhost2:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.ns1</name>
<value> Myhost2:50070</value>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>/home/yuling.sh/datanode</value>
</property>