Hadoop(一) Windows安装

本文档提供了详细的步骤来帮助读者完成Hadoop单机版的安装与配置,包括环境变量设置、配置文件修改及服务启动等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、下载hadoop

二、配置hadoop

  • 首先配置环境变量 
    1.新建HADOOP_HOME变量     2.在path中添加  %HADOOP_HOME%\bin,
  • 配置hadoop文件 
    所有的配置文件都在D:\hadoop\etc\hadoop的目录下,使用记事本打开.

    • 文件1:D:\hadoop\etc\hadoop\hadoop-env.cmd jdk路径不要有空格

      set JAVA_HOME=D:\Java\jdk1.8
    • 文件2:D:\hadoop\etc\hadoop\core-site.xml

        <configuration>
          <property>  
          <name>fs.default.name</name>  
          <value>hdfs://localhost:9000</value>  
         </property>     
        </configuration>
    • 文件3:D:\hadoop\etc\hadoop\hdfs-site.xml

      <configuration>
      <property>  
        <name>dfs.replication</name>  
        <value>1</value>  
      </property>
      <property>
              <name>dfs.namenode.name.dir</name>
              <value>file:/hadoop/data/dfs/namenode</value>
      </property>
      <property>
              <name>dfs.datanode.data.dir</name>
              <value>file:/hadoop/data/dfs/datanode</value>
      </property> 
      </configuration>
    • 文件4:D:\hadoop\etc\hadoop\mapred-site.xml mapred-site.xml是复制mapred-site.xml.template,去掉template

      <configuration>
          <property>
             <name>mapreduce.framework.name</name>
             <value>yarn</value>
          </property>
      </configuration>
    • 文件5:D:\hadoop\etc\hadoop\yarn-site.xml 
      <configuration>
          <property>
             <name>yarn.nodemanager.aux-services</name>
             <value>mapreduce_shuffle</value>
          </property>
          <property>
             <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
             <value>org.apache.hadoop.mapred.ShuffleHandler</value>
          </property>
      </configuration>


三、启动hadoop

使用管理员运行cmd

hadoop namenode -format //格式化hdfs
cd xx/hadoop/sbin //进入到sbin目录下
start-dfs.cmd   //先启动dfs  
start-yarn.cmd  //再启动yarn  
//或者
//start-all.cmd //相当于以上的两条命令

这里写图片描述

启动完成,在地址栏输入http://localhost:8088 
这里写图片描述
在地址栏输入http://localhost:50070 
这里写图片描述

正常访问,安装完成 。

详细配置参考 : http://blog.youkuaiyun.com/xuechongyang/article/details/8691518


配置好环境变量后,打开cmd 输入hadoop version 的时候出现以下错误:

Error: JAVA_HOME is incorrectly set.

Please update F:\hadoop\conf\hadoop-env.cmd

1.用路径替代符

C:\PROGRA~1\Java\jdk1.8.0_91

PROGRA~1  ===== C:\Program Files 目录的dos文件名模式下的缩写
长于8个字符的文件名和文件夹名,都被简化成前面6个有效字符,后面~1,有重名的就 ~2,~3,



### Hadoop 3.3.0 在 Windows 上的安装指南 #### 准备工作 在开始安装前,需确保已准备好以下必要组件: - **Hadoop 压缩包**: 可通过官方 Apache 存档站点获取 `hadoop-3.3.0.tar.gz` 文件[^1]。 - **Winutils 工具支持文件**: 运行 Hadoop on Windows 需要特定版本的 winutils hadoop.dll 文件。这些文件应与所使用的 Hadoop 版本匹配 (Hadoop 3.3.0)[^2]。 #### 系统环境配置 1. **Java 开发环境** 安装 JDK 1.8 或更高版本,并设置 JAVA_HOME 环境变量指向 Java 的安装路径。验证命令如下: ```bash java -version ``` 2. **解压 Hadoop 压缩包** 将下载的 `hadoop-3.3.0.tar.gz` 文件解压至目标目录。例如,可以将其放置于 C:\hadoop\ 并创建相应的子目录结构[^4]: ```bash tar -xzvf hadoop-3.3.0.tar.gz -C /path/to/target/directory/ ``` 3. **配置 Winutils 支持** 下载并提取适合 Hadoop 3.3.0 的 winutils.exe hadoop.dll 文件[^2]。将它们复制到 `%HADOOP_HOME%\bin` 目录下,并确认其可执行权限已被正确赋予。 4. **修改核心配置文件** 编辑 Hadoop 主目录下的配置文件 core-site.xml, hdfs-site.xml, mapred-site.xml yarn-site.xml 来适配本地开发需求。以下是部分示例配置片段: #### core-site.xml 设置临时存储位置以及默认文件系统 URI: ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/tmp/hadoop-${user.name}</value> </property> </configuration> ``` 5. **启动服务** 使用脚本来初始化 NameNode DataNode 同时开启 YARN ResourceManager/Datanode 组件。注意,在首次运行之前可能需要格式化 namenode 数据库: ```bash bin/hdfs namenode -format sbin/start-dfs.sh sbin/start-yarn.sh ``` 完成上述步骤之后即可成功部署单节点伪分布模式或者多节点全分布式架构下的 Hadoop 实验平台。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值