Linux环境Hadoop伪分布模式安装详解

本文详细介绍Hadoop伪分布式模式的安装与配置过程,包括JDK安装配置、Hadoop环境搭建、关键配置文件详解等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

http://www.cnblogs.com/zhangwenjing/p/3583350.html

伪分布式模式下,Hadoop将所有进程运行于同一台主机上,但此时Hadoop将使用分布式文件系统,而且各jobs也是由JobTracker服务管理的独立进程。同时,由于伪分布式的Hadoop集群只有一个节点,因此HDFS的块复制将限制为单个副本,其secondary-master和slave也都将运行于本地主机。此种模式除了并非真正意义的分布式之外,其程序执行逻辑完全类似于完全分布式,因此,常用于开发人员测试程序执行。

hadoop的配置共有四种级别:集群、进程、作业和单独操作,前两类由集群管理员负责配置,后面的两类则属于程序员的工作范畴。

hadoop的配置文件位于conf目录中,其中的core-site.xmlmapred-site.xmlhdfs-site.xml三个配置文件最为关键。core-site.xml用于配置hadoop集群的特性,它作用于全部进程及客户端,mapred-site.xml配置mapreduce集群的工作属性,hdfs-site.xml配置hdfs集群的工作属性。

另外还有三个配置文件需要留意。hadoop-env.sh是Hadoop的多个脚本执行时source的配置信息,其用于为Hadoop指定运行时使用的JDK、各进程的JDK属性、PID文件及日志文件的保存目录等。masters则用于指定辅助名称节点(SecondaryNameNode)的主机名或主机地址,slaves用于指定各从服务器(TaskTracker或DataNode)的主机名或主机地址。对伪分布式的Hadoop集群来讲,这些节点均为本机。

一、JDK安装与配置

      详情请见:http://www.cnblogs.com/zhangwenjing/p/3580726.html

二、Hadoop安装与配置

     1、Hadoop下载与安装

       地址:http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.3.0/hadoop-2.3.0.tar.gz

     使用wget命令下载:wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.3.0/hadoop-2.3.0.tar.gz

       解压缩:tar -zxvf hadoop-2.3.0.tar.gz

     重命名:mv hadoop-2.3.0 hadoop

          #vi ect/profile

          HADOOP_PREFIX=/opt/hadoop 

          PATH=$HADOOP_PREFIX/bin:$PATH 

          export HADOOP_PREFIX PATH 

         执行环境配置:source /etc/profile

         验证:hadoop -version

     2、Hadoop配置

         Hadoop配置在hadoop/etc/hadoop下,作如下修改:

    hadoop-env.sh

         export JAVA_HOME=/usr/local/java/jdk1.7.0_51(JDK安装目录)

         修改内存大小:export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"

     core-site.xml做如下配置:

         <configuration>

      <!--NameNode的IP地址和端口--> 
          <property> 
             <name>fs.defaultFS</name> 
             <value>hdfs://localhost:9000</value> 
          </property> 
          <property> 
              <name>hadoop.tmp.dir</name> 
              <value>/tmp/hadoop/hadoop-${user.name}</value>
          </property> 
        </configuration>

          hdfs-site.xml做如下配置(系统默认文件保存3份,因伪分布模式,故改为1份):

          <configuration> 
           <property> 
              <name>dfs.replication</name> 
                <value>1</value> 
            </property> 

      <property>
                    <name>dfs.namenode.name.dir</name>
                    <value>/hadoop/namenode</value>
              </property>
              <property>
                    <name>dfs.datanode.data.dir</name>
                    <value>/hadoop/datanode</value>
              </property>
          </configuration>

      mapred-site.xml做如下配置:

    <configuration> 

            <property> 
                 <name>mapreduce.jobtracker.address</name> 
                 <value>localhost:9001</value> 
            </property> 

         </configuration>

     hadoop2.0有了yarn所以原来的mapred配置都转向yarn-site.xml文件中了,这里也就指定yarn。

     yarn-site.xml,为方便,未进行配置。

         core-site.xml配置参考:http://hadoop.apache.org/docs/r2.3.0/hadoop-project-dist/hadoop-common/core-default.xml

    hdfs-site.xml配置参考:http://hadoop.apache.org/docs/r2.3.0/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

    mapred-site.xml配置参考:http://hadoop.apache.org/docs/r2.3.0/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

         yarn-site.xml配置参考:http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

         执行hadoop环境配置:source /opt/hadoop/etc/hadoop/hadoop-env.sh 

   由于启动hadoop需一遍遍输入密码,不方便,故设置ssh免密登陆本机

         ssh-keygen -t rsa -P "" 输入这个命令后一直回车就可以了

         cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys

         切换到安装目录

         格式化namenode:./bin/hadoop namenode –format

    启动hadoop:./sbin/start-all.sh设置ssh免密登陆本机

         检查进程是否启动:jps

         

          有以上内容说明已经启动

      hadoop资源管理页面:http://localhost:8088

    namenode节点信息:http://localhost:50070

LinuxLinuxLinuxLinuxLinux5.65.65.6企业版 企业版 下成功搭建 下成功搭建 下成功搭建 HadoopHadoopHadoopHadoopHadoopHadoop伪分布 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 测试环境。本次在一台服务 器上进行伪分布式搭建。 器上进行伪分布式搭建。 器上进行伪分布式搭建。 器上进行伪分布式搭建。 器上进行伪分布式搭建。 器上进行伪分布式搭建。 Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop 分布式, 分布式, 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 单机上的分布式并不是真正伪,而使用线程模拟。 Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop 本身 是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是无法区分伪布式 和的,两种配置也很相似唯一不同地方是在单机器上配置,数据节点和名字均一个。 是在单机器上配置,数据节点和名字均一个。 是在单机器上配置,数据节点和名字均一个。 是
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值