之前学习Hadoop都是在VMWare虚拟机上的Linux系统上以伪分布模式部署的,最近领导对GreenPlum比较感兴趣,申请了7台物理机,也就有机会在7台物理组成的集群中以全分布模式部署Hadoop了。在部署Hadoop之前,领导已经将该7台物理机的ssh配置好了,若不熟悉ssh的配置可以参考文章http://blog.youkuaiyun.com/skywalker_only/article/details/17356039。除了ssh不需要配置外,该7台物理机上没有安装Java,所以还需要安装Java,配置Java环境变量。关于如何下载Java,上传到7台主机就不再一一赘述。下面描述一下安装Java时遇到的问题,因为这是第一次在别人装好的系统上安装Java,所以还是将所有遇到的问题及解决方案记录了下来。
第一个问题是这样的,以gpadmin用户安装Java时报出了error:can't create transaction lock on /var/lib/rpm/__db.000的错误,经排查是gpadmin对/var/lib/rpm/没有权限导致的,那么切换用户到root后成功安装Java到/usr/java/jdk1.6.0_45中。7台主机都是以root用户安装Java的,并配置Java环境变量到/etc/profile中。
第二个问题是在成功安装Java并设置了环境变量后,运行java –version的结果如下:

本文详细记录了在7台物理机组成的集群中以全分布模式部署Hadoop的过程,包括安装Java、配置环境变量、解决版本显示错误、配置Hadoop环境以及修改相关配置文件。在部署过程中遇到的error:can't create transaction lock on /var/lib/rpm/__db.000问题,通过切换用户解决。此外,通过调整PATH解决了Java版本显示错误。最后,成功启动并验证了Hadoop集群的运行状态。
订阅专栏 解锁全文
1840





