Hadoop安装手册


hadoop安装手册

步骤一 虚拟机的安装

首先下载最新版本的Linux的iso文件,可以在http://www.linuxdown.net/下载

我选择的是CentOS7.1版本。

然后下载VMWare workstation,VMWare的安装因为比较简单在这里就略过,我这里选择的是##VMwareworkstation_full_12.2.0.1269版本在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

安装完成后系统会要求一些密钥 下面是我分享的可用的一些密钥
5A02H-AU243-TZJ49-GTC7K-3C61N
5A02H-AU243-TZJ49-GTC7K-3C61N
VY1DU-2VXDH-08DVQ-PXZQZ-P2KV8
VF58R-28D9P-0882Z-5GX7G-NPUTF
YG7XR-4GYEJ-4894Y-VFMNZ-YA296
VF5XA-FNDDJ-085GZ-4NXZ9-N20E6
UC5MR-8NE16-H81WY-R7QGV-QG2D8

在这里插入图片描述

二、Hadoop基础环境的配置

1前置操作:使我创建的用户获得管理权限

step1:切换到管理员用户

由于我们安装的是LinuxGUI界面,因此我们可以直接手动在GUI界面用户登录界面切换至root用户

在这里插入图片描述

在这里插入图片描述

(root用户的密码在安装虚拟机时由自己设置)

进入root后

在这里插入图片描述
打开终端
在这里插入图片描述
输入chomd u+w /etc/sudoers 此代码是将系统文件sudoers可读 以进行后面的操作
在这里插入图片描述
用vim/etc/sudoers 打开sudoers文件 或者用图形界面打开(操作简单,不进行详细说明)
在这里插入图片描述
如图所示 找到第98行代码root ALL=(ALL) ALL 复制在下一行,然后将root改为我们想要赋予管理权限的普通用户名称,然后esc+:+wq保存退出

保存完毕后我们退出root用户,登录刚才赋予权限的用户,然后打开终端,输入以下代码

在这里插入图片描述
在这里插入图片描述

2基础网络环境的配置

在这里插入图片描述
根据以上步骤打开网络设置
在这里插入图片描述

在这里插入图片描述网络地址 网络掩码 网关需要点击虚拟机菜单栏的编辑选项中的虚拟网络编辑器,打开Nat设置,操作如下:
在这里插入图片描述
在这里插入图片描述 ## 注意:子网IP最后一位不能为0,255,1,2.需要从3~254之间选择
子网掩码不变,网关IP不变。DNS可以为8.8.8.8 去某度搜各地的即可。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
3(配置网络地址与主机名的对应关系)
首先在终端里输入
Sudo vim /etc/hostname
将此文件内容全部删除,更改为你的当前操作主机的主机名
Sudo vim /etc/hosts
在最后新建一行,添加以下内容
IP地址1 主机名1
IP地址2 主机名2
IP地址3 主机名3
如图所示:
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述4.1.1.3关闭防火墙
查看防火墙状态
Systemctl status firewalld.service
关闭防火墙
Systemctl strop firewalld.service
查看服务开启启动项列表
Systemctl list-unit-files
设置防火墙开机不自动启动
Systemctl disable firewalld.service

三、免密登陆首先生成公私钥

首先输入Ssh-keygen -t rsa创建公钥
在这里插入图片描述
打开用户目录下的.ssh目录
(1)cd
cd .ssh
在这里插入图片描述
(2)将公钥文件拷贝成authorized_keys
(3)验证Ssh 本节点主机名,若无需输入密码可直接登录则设置成功
在这里插入图片描述

四、jdk安装

复制jdk文件(.tar.gz格式)到用户目录下
在此目录下新建java目录,将安装包移动到该目录下解压
Tar zxvf 压缩包名
在这里插入图片描述
解压后为了方便后期操作,将解压后目录名重命名为jdk(使用mv改名)
在这里插入图片描述在这里插入图片描述
打开并编辑用户目录下的.\bashrc文件
Vim ~/.bashrc
在正文的后面添加以下内容
Export JAVA_HOME=/home/ryan/java/jdk
Export PATH= P A T H : PATH: PATH:JAVA_HOME/bin
保存退出
在这里插入图片描述
让该文件立即生效
Source ~/.bashrc
卸载已有jdk(可选)
查询已安装包名中包含jdk的
Rpm -qa |grep jdk
卸载方法
Rpm -e 包名 --nodeps(忽略依赖关系)
使用java -version命令验证
如果显示版本号与安装版本号相同,则证明安装成功了
在这里插入图片描述

五、hadoop的安装

首先将hadoop安装包复制到用户目录下,新建hadoop目录。将安装包移动到该目录下解压。
将解压完成后的目录(hadoop-2.6.2)改名为hadoop(为了方便)

上述操作同给jdk解压改名,在此不再次说明。

将hadoop根目录下的bin目录和sbin目录路径加入到PATH中
更改~/.bashrc文件如下
export JAVA_HOME=/home/ryan/java/jdk
export HADOOP_HOME=/home/ryan/hadoop/hadoop
export PATH= P A T H : PATH: PATH:JAVA_HOME/bin: H A D O O P H O M E / b i n : HADOOP_HOME/bin: HADOOPHOME/bin:HADOOP_HOME/sbin
在这里插入图片描述
改完后,执行source命令令其立即生效
使用hadoop version验证是否成功
在这里插入图片描述

六、hadoop的配置

3.1在$HADOOP_HOME/etc/hadoop/目录下
需要配置以下文件
Hadoop-env.sh
export JAVA_HOME=/home/klh/java/jdk
在这里插入图片描述

Yarn-env.sh
export JAVA_HOME=/home/klh/java/jdk
在这里插入图片描述
Core-site.xml
在configuration标签中添加以下变量和值

fs.defaultFS
hdfs://node-1:9000


hadoop.tmp.dir
/home/ryan/hadoop/hadoop/tmp

在这里插入图片描述

Hdfs-site.xml
(如果不设置该参数,则默认值为3)
dfs.replication
2

(如果不设置该参数,则默认值为 h a d o o p . t m p . d i r / d f s / n a m e ) &lt; n a m e &gt; d f s . n a m e n o d e . n a m e . d i r &lt; / n a m e &gt; &lt; v a l u e &gt; / h o m e / k l h / h a d o o p / h a d o o p / t m p / d f s / n a m e &lt; / v a l u e &gt; &lt; / p r o p e r t y &gt; &lt; p r o p e r t y &gt; ( 如 果 不 设 置 该 参 数 , 则 默 认 值 为 hadoop.tmp.dir/dfs/name) &lt;name&gt;dfs.namenode.name.dir&lt;/name&gt; &lt;value&gt;/home/klh/hadoop/hadoop/tmp/dfs/name &lt;/value&gt; &lt;/property&gt; &lt;property&gt;(如果不设置该参数,则默认值为 hadoop.tmp.dir/dfs/name)<name>dfs.namenode.name.dir</name><value>/home/klh/hadoop/hadoop/tmp/dfs/name</value></property><property>(hadoop.tmp.dir/dfs/data)
dfs.datanode.data.dir
/home/klh/hadoop/hadoop/tmp/dfs/data

在这里插入图片描述

Mapred-site.xml

mapreduce.framework.name
yarn

在这里插入图片描述
Yarn-site.xml

yarn.resourcemanager.address
rmhostname:8032

在这里插入图片描述
Slaves
在此文件中写明所有从节点的节点名,一行一个(如果为伪分布式部署,则默认localhost即可,无需更改)

伪分布式安装:

3.2格式化并启动hadoop
格式化代码:
hadoop namenode format
启动代码 :
start-all.sh
3.3根据运行日志定位问题点
在这里插入图片描述# 伪分布式安装
1.克隆两个node-1(主节点)的虚拟机,并分别命名为node-1,node-2
2.进入修改网络设置,为了方便我把node-2,node-3网段最后两位分别写为120,130.
在这里插入图片描述在这里插入图片描述在这里插入图片描述3.进入node-1,2,3的hostname文件作以下更改
在这里插入图片描述在这里插入图片描述在这里插入图片描述4.再分别进入node-1,2,3进入hosts文件做以下更改
在这里插入图片描述在这里插入图片描述在这里插入图片描述5.生成node-2 node-3的公私钥
在这里插入图片描述在这里插入图片描述
把node-2的公私钥复制到node-1中去
在这里插入图片描述

查看是否复制成功
在这里插入图片描述复制node-3的公私钥到node-1去,并查看是否复制成功。

在这里插入图片描述

把node-2 node-3的公私钥合并为authorized_keys
在这里插入图片描述
查看是否和并成功 图中箭头所指node-1 node-2 node-3出现了 则成功合并
在这里插入图片描述
把新生成的authorized_keys 发送给node-2 node-3一人一份 来实现免密登陆
在这里插入图片描述
三个用户分别设置修改authorized-keys的权限 -600

在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述
三个虚拟机同时打开时主节点会打开以下四个功能
在这里插入图片描述
node-2会打开以下三个功能
在这里插入图片描述 node-3打开以下三个功能 则成功
在这里插入图片描述


### Hadoop安装部署的相关手册或指南 Hadoop安装和部署通常涉及多个步骤,包括环境准备、软件下载、解压配置以及集群节点设置等内容。以下是基于已有引用内容整理的 Hadoop 安装部署教程概述: #### 1. 下载解压 首先需要下载 Hadoop 压缩包,并将其解压到指定目录下。例如,在 `/data/` 路径下完成解压操作并将文件夹重命名以便于管理[^1]。 ```bash tar zxvf hadoop-3.3.4.tar.gz -C /data/ mv /data/hadoop-3.3.4 /data/hadoop ``` #### 2. 配置主机名 IP 地址映射 为了实现分布式计算功能,需定义各节点的角色及其对应的网络地址。以下是一个典型的三节点集群配置示例[^2]: | 主机名 | IP 地址 | 用户名 | HDFS角色 | YARN角色 | |--------|--------------|----------|---------------------|------------------| | hadoop01 | 172.16.126.71 | hadoop | NameNode | ResourceManager | | hadoop02 | 172.16.126.72 | hadoop | DataNode, SecondaryNameNode | NodeManager | | hadoop03 | 172.16.126.61 | hadoop | DataNode | NodeManager | #### 3. 修改核心配置文件 YARN 是 Hadoop 中负责资源管理和调度的重要组件之一。通过编辑 `yarn-site.xml` 文件来设定 ResourceManager 所运行的具体服务器名称[^3]。 ```xml <property> <name>yarn.resourcemanager.hostname</name> <value>hadoop01</value> </property> ``` 以上代码片段指定了 ResourceManager 将会在名为 "hadoop01" 的机器上启动服务。 #### 4. 启动验证 最后一步就是按照官方文档或者社区分享的最佳实践逐步初始化整个框架并测试其基本功能是否正常工作。 --- ### 提供更多参考资料建议 对于希望深入了解如何正确实施这些过程的学习者来说,除了上述提到的内容外还可以查阅其他权威书籍和技术博客文章作为补充材料进一步巩固理解程度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值