一步步带你搭建Hadoop伪分布式

viviju1989

于 2013-06-03 12:23:53 发布

阅读量851

点赞数

分类专栏： hadoop 文章标签： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/viviju1989/article/details/9012293

版权

hadoop 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了如何在 Red Hat Linux 5 的虚拟机上配置 Hadoop 1.1.2 版本的伪分布式环境，包括 SSH 免密码登录设置、JDK 安装及环境变量配置、Hadoop 安装包下载与解压、核心配置文件修改、HDFS 格式化及启动步骤等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

运行环境：虚拟机linux redhat5（ip：192.168.200.129）

Hadoop版本：1.1.2

第一步：配置SSH免密码登陆（非必须，但是如果不配置，在启动和停止hadoop时都需要重复输入密码，所以最好配置此项）

一般来说，redhat5默认安装了SSH，所以不需要我们再单独安装SSH，如果没有则自行先安装SSH，配置ssh免密码登陆只需要2条命令即可：

ssh-keygen -t rsa -P -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

完成上面2步后，你可以输入 ssh localhost，如果出现下面字样，则表示配置ssh成功

[root@master~]# ssh localhost

Lastlogin: Mon Jun 3 10:22:37 2013 from192.168.200.129

第二步：配置jdk和环境变量，输入 env |grep JAVA_HOME，如果出现如下输出则表示jdk配置成功：

JAVA_HOME=/usr/java/jdk1.6.0_03

第三步：下载hadoop 1.1.2 的安装包 hadoop-1.2.0-bin.tar.gz 或下载其他版本

（http://mirrors.cnnic.cn/apache/hadoop/common/），上传到/usr/hadoop 下，并解压

第四步：修改配置文件，需要修改4个配置文件，都位于hadoop解压根目录的conf文件夹下，此处修改均为为最简配置

1. hadoop-env.sh

你会看到配置文件中大约第8行注释掉了JAVA_HOME的配置，在该行下面添加

export JAVA_HOME=/usr/java/jdk1.6.0_03

2. core-site.xml，修改后如下

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://192.168.200.129:9000</value>

</property>

</configuration>

3. hdfs-site.xml，修改后配置如下

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

4. mapred-site.xml，修改后配置如下

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>192.168.200.129:9001</value>

</property>

</configuration>

到此为止，hadoop伪分布式就配置完成了，下面介绍如何启动和简单使用hadoop

第五步：格式化hadoop的文件系统hdfs，进入hadoop目录 /hadoop-1.2.0/bin，输入命令

[root@master bin]# ./hadoop namenode -format

会看到有一些带*行的输出，没有报错说明格式化成功

第六步：启动hadoop，也在目录/hadoop-1.2.0/bin下运行命令

[root@master bin]# ./start-all.sh

会看到命令行输出

startingdatanode ······

startingsecondarynamenode ······

startingjobtracker ······

startingtasktracker ······

则表示已经成功启动hadoop了，那么如何可以直观的看到hadoop的运行状态呢，可以在网页中输入：

http://192.168.200.129:50070 可以查看HDFS的web页面

http://192.168.200.129:50030 可以查看MapReduce的web页面

在hdfs页面中有一个链接Browse thefilesystem 可以查看hadoop的文件系统

注意：很多时候会跳转会失败显示该页无法显示，需要修改2处地方，第一，修改虚拟机中的network connettion为桥接模式（Bridged），第二步需要在客户端的hosts文件里加入hadoop的ip地址与对应的主机名（如：192.168.200.129 master ，master为你linux主机的hostname），这样就可以正常访问了。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。