一、虚拟机环境准备
-
新建虚拟机
-
修改虚拟机的静态
IP
Vmware
虚拟机下三种网络模式配置:https://blog.youkuaiyun.com/collection4u/article/details/14127671- 配置静态
IP
:https://www.codercto.com/a/52805.html
-
修改主机名:https://blog.youkuaiyun.com/musicenchanter/article/details/80572070
-
关闭防火墙
systemctl stop firewalld.service#停止firewall systemctl disable firewalld.service#禁止firewall开机启动
-
创建
hadoop
(可自定义名字)用户useradd -m hadoop -s /bin/bash # 创建新用户hadoop passwd hadoop # 设置用户密码
-
配置
hadoop
用户具有root
权限visudo # 为 hadoop 用户增加管理员权限 # 在 root ALL=(ALL) ALL下添加一行 hadoop ALL=(ALL) ALL
-
创建所需文件夹(根据个人需要创建)
二、安装JDK
- 卸载现有的
JDK
- 将
JDK
包导入到Linux
下相关目录中 - 查看是否导入成功
- 解压
JDK
包到相关目录下 - 配置
JDK
环境变量 - 验证
JDK
是否安装成功 - 注:修改后的文件使用source命令使该文件生效
三、安装Hadoop
Hadoop
下载地址- 将
Hadoop
包导入到Linux
下相关目录中 - 查看是否导入成功
- 解压
Hadoop
包到相关目录下 - 配置
Hadoop
环境变量 - 测试
Hadoop
是否安装成功 - 注:修改后的文件使用
source
命令使该文件生效;若hadoop
命令仍不能使用,可尝试重启虚拟机
四、Hadoop
的目录结构
bin
目录:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本etc
目录:Hadoop的配置文件目录,存放Hadoop的配置文件include
目录lib
目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)libexec
目录LICENSE.txt
目录NOTICE.txt
目录README.txt
目录sbin
目录:存放启动或停止Hadoop相关服务的脚本share
目录:存放启动或停止Hadoop相关服务的脚本