网上查询资料,实际配置后整理记录。
一、下载安装配置 1.8.0 以上版本 java 环境
完成后,使用 java -version 命令查看是否成功。
二、下载 hadoop-2.7.4.tar.gz
地址:http://hadoop.apache.org/releases.html
将文件解压至无空格目录下即可,下面是目录结构:
文件夹访问权限修改,添加(Everyone)完全控制权限
三、下载 Hadoop 2.7.4 Windows 64位 编译bin
网上提供的下载地址:http://download.youkuaiyun.com/download/a2728196/9966285
将压缩包里的 bin 目录下文件替换官网 hadoop 目录下的 bin 目录。
四、配置所需系统环境变量
1、新建 HADOOP_HOME,如下图 :
2、Path 变量中 新建,如下图:
3、新建 HADOOP_CONF_DIR,如下图 :
4、测试是否配置成功
打开 cmd 窗口,执行 hadoop version,如下图:
五、修改 Hadoop 配置文件(namenode,datanode运行读取)
注意:
配置文件里windows所有盘符前要加/,比如: /D:/XXXXXXXXXX
编辑“ D:\SDE\Hadoop2.7.4\etc\hadoop ”下的配置文件,参考配置如下:
1、core-site.xml
fs.defaultFS
hdfs://localhost:8010
HDFS的URI,文件系统://namenode标识:端口号
hadoop.tmp.dir
/D:/SDE/Hadoop2.7.4/workplace/tmp
namenode上本地的hadoop临时文件夹
2、hdfs-site.xml:
dfs.replication
1
副本个数,配置默认是3,应小于datanode机器数量
dfs.name.dir
/D:/SDE/Hadoop2.7.4/workplace/name
namenode上存储hdfs名字空间元数据
dfs.data.dir
/D:/SDE/Hadoop2.7.4/workplace/data
datanode上数据块的物理存储位置
3、mapred-site.xml:
mapreduce.framework.name
yarn
4、yarn-site.xml
yarn.nodemanager.aux-services
mapreduce_shuffle
yarn.nodemanager.resource.memory-mb
1024
yarn.nodemanager.resource.cpu-vcores
1
六、启动
1、cmd 执行 hdfs namenode -format 指令格式化系统文件。
2、格式化完成后,到 hadoop/sbin 目录下执行 start-dfs 或 start-all 指令,启动hadoop
使用 start-dfs 会启动 namenode 和 datanode 进程,如下图:
使用 start-yarn 会启动 resourcemanager 和 nodemanager 进程,如下图:
使用 start-all 会启动全部 4 个进程,如下图:
注意:This script is Deprecated(弃用). Instead use start-dfs.cmd and start-yarn.cmd starting yarn daemons
至此,hadoop 服务搭建完毕。