Hadoop-Hadoop应用总结（转载）

最新推荐文章于 2022-04-28 20:41:58 发布

GP0071

最新推荐文章于 2022-04-28 20:41:58 发布

阅读量1.7k

点赞数

分类专栏： Hadoop 文章标签： Hadoop 集群

Hadoop 专栏收录该内容

18 篇文章

订阅专栏

本文详细介绍了在Linux Ubuntu环境下配置环境，包括安装系统、SSH密钥生成实现无密码登录、关闭防火墙、安装JDK 1.6及Hadoop伪分布配置。同时提供了操作命令及HDFS文件系统的操作方法，如格式化工作空间、启动HDFS、文件目录创建、删除等基本操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转http://lxm63972012.iteye.com/blog/1433307

环境配置

1. 安装linux ubuntu系统

2. 安装开启openssh-server：$ sudo apt-get install openssh-server

3. 建立ssh 无密码登录

           $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

           直接回车，完成后会在~/.ssh/生成两个文件：id_dsa 和id_dsa.pub。

           这两个是成对出现，类似钥匙和锁。再把id_dsa.pub 追加到授权key 里面(当前并没有authorized_keys文件)：

           $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys。

           完成后可以实现无密码登录本机：$ ssh localhost。

       4.关闭防火墙 $ sudo ufw disable

5. 安装jdk 1.6

6. 安装后，添加如下语句到/etc/profile 中：

           export JAVA_HOME=/home/Java/jdk1.6

           export JRE_HOME=/home/Java/jdk1.6/jre

           export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

           export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

Hadoop伪分布配置
1. 在conf/hadoop-env.sh文件中增加：export JAVA_HOME=/home/Java/jdk1.6

2. 在conf/core-site.xml文件中增加如下内容：

    <property>
          <name>fs.default.name</name>
          <value>hdfs://localhost:9000</value>
    </property>

<!—hadoop.tmp.dir 是hadoop文件系统依赖的基础配置，很多路径都依赖它。如果hdfs-site.xml中不配置namenode和datanode的存放位置，默认就放在这个路径中-->
   <property>
      <name>hadoop.tmp.dir</name>
      <value>/home/hdfs/tmp</value>
   </property>

3. 在conf/hdfs-site.xml中增加如下内容：

     <property>
         <name>dfs.replication</name>
         <value>1</value>
     </property>

    <property>
         <name>dfs.name.dir</name>
         <value>/home/hdfs/name</value>
    </property>
    <property>
        <name>dfs.data.dir</name>
        <value>/home/hdfs/data</value>
    </property>
4. 在conf/mapred-site.xml中增加如下内容：

<property>
       <name>mapred.job.tracker</name>
       <value>localhost:9001</value>
</property>