hadoop集群安装指南-hadoop3.2.4版本

champion_风雨中

已于 2022-09-19 17:53:46 修改

阅读量2.1k

点赞数 1

分类专栏：数据中台文章标签： hadoop hdfs

于 2022-09-19 17:45:59 首次发布

本文链接：https://blog.youkuaiyun.com/champion2009/article/details/126938328

版权

hadoop3.2.4集群安装指南

下载地址：https://archive.apache.org/dist/hadoop/common/

前置准备

     三台服务器
     10.243.80.42 
     10.243.80.43 
     10.243.80.44

1:安装jdk1.8

2:修改主机名方便集群间的访问

 hostname hadoop42
 hostname hadoop43
 hostname hadoop44
 同步修改/etc/hosts文件
 10.243.80.42 hadoop42
 10.243.80.43 hadoop43
 10.243.80.44 hadoop44

3:配置SSH免密码远程登录

     一、创建公钥/私钥
        ssh-keygen -t rsa 然后yes加一路回车
    二、将公钥拷贝到要免密登录的目标机器上
       ssh-copy-id hadoop42
       ssh-copy-id hadoop43
       ssh-copy-id hadoop44

4:创建hadoop用户

1：增加hadoop用户和密码
adduser hadoop
passwd hadoop
2：把hadoop加入hadoop用户组
usermod -a -G hadoop hadoop
3：然后用cat /etc/group |grep hadoop 查看结果
4：增加hadoop的权限
vi  /etc/sudores
hadoop ALL=(ALL)       ALL
5：将hadoop文件夹的所有者指定为hadoop用户
chown -R hadoop:hadoop /data01/bigdata/hadoop-3.2.4

hadoop安装

1.下载解压hadoop包

下载地址：http://archive.apache.org/dist/hadoop/core/
tar -no-same-owner -zxvf hadoop-3.2.4.tar.gz
创建软连接---方便版本升级
ln -s hadoop-3.2.4 hadoop
chown -R hadoop:hadoop /data01/bigdata/hadoop

2.修改环境变量

vim /etc/profile 添加
export HADOOP_HOME=/data01/bigdata/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

3:Hadoop集群配置=HDFS集群配置 + MapReduce集群配置 + Yarn集群配置

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

champion_风雨中

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hadoop3.2.4集群部署（centos7.9)

w975121565的博客

10-20

1331

Hadoop3.2.4集群部署（centos7.9)

Hadoop3.2.4+Hive3.1.2+sqoop1.4.7安装部署

alicely07的博客

02-04

4169

Hive：Hadoop3.2.4+Hive3.1.2+sqoop1.4.7安装部署

1 条评论您还未登录，请先登录后发表或查看评论

分布式安装配置Hadoop3.2.4

runepic的博客

06-02

1482

本文介绍如何在Ubuntu系统中安装配置Hadoop。Hadoop是一个开源的分布式计算框架，它可以处理大规模的数据集。Hadoop的核心组件是Hadoop分布式文件系统（HDFS）和MapReduce编程模型。Hadoop还包括一些其他的子项目，如Hive，Pig，Spark等，提供了不同层次的数据处理能力。

Hadoop大数据平台部署（Hadoop3.2.4+Hive4.0.1）

CDHong.it的技术分享博客

04-14

950

1、前置要求与规划2、基础环境配置3、Hadoop 3.2.4 集群部署4、MariaDB 10.6.x 安装（仅 master 节点）5、Hive 4.0.1 部署（仅 master 节点）6、Hive 离线数据预处理7、Sqoop导出预处理结果到MySQL。

【Hadoop】Hadoop(一)3.2.4集群搭建

JeffHan^_^的博客

04-27

859

可以看到resourcemanager的管理界面也已经启动，我这里启动了一个Flink的yarn任务，所以可以看到一个Application。在 hadoop解压目录下的 etc/hadoop下修改下面配置。在进行Hadoop集群部署之前，我们需要事先准备好以下几个条件。访问 http://192.168.37.128:9870。访问http://192.168.37.128:8088。可以看到两台dataNode节点都在线。在centos1上启动集群。

Hadoop3.2.4集群安装

cqkcm的博客

01-09

528

bin/hdfs dfs -get /newland/mr/input/test.txt /home/hdfs/test/ 红色为本地指定目录。bin/hdfs dfs -put /home/hdfs/test.txt /newland/mr/input 上传文件到特定目录。bin/hdfs dfs -put /home/hdfs/wordcount.txt / 将文件放入分布式系统中。删除文件 bin/hdfs dfs -rm /newland/mr/input/profile。

hadoop-3.2.4.tar.gz

07-31

安装和运行Hadoop 3.2.4时，你需要解压此压缩包，配置`conf`目录下的配置文件，如`core-site.xml`、`hdfs-site.xml`和`yarn-site.xml`，然后根据官方文档的指导启动和管理Hadoop服务。为了测试Hadoop集群，你可以...

spark-3.2.4-bin-hadoop3.2-scala2.13 安装包

08-28

为了与Hadoop集群对接，还需要配置Spark的`spark-env.sh`文件，设置Hadoop的相关路径。 5. **运行Spark**: Spark可以通过命令行工具启动，例如`spark-shell`（交互式Spark会话）或`pyspark`（Python版本的交互式...

hadoop-eclipse-plugin-3.3.1.jar

01-03

Ubuntu虚拟机HADOOP集群搭建eclipse环境 hadoop-eclipse-plugin-3.3.1.jar

(非常详细）大数据平台学习·环境安装配置（二）（Hadoop3.2.4版集群搭建）

Spark_BITZH的博客

10-22

1962

大数据平台入门之搭建Hadoop集群

Hadoop 3.2.4 集群搭建详细图文教程

GG Bond 的博客

09-01

6201

Hadoop 3.2.4 集群搭建详细图文教程

01 hadoop 3.2.4集群搭建.html

07-31

hadoop 3.2.4集群搭建

1 Hadoop 3.2.4分布式环境搭建

fmi110的博客

07-31

2098

hadoop 3.2.4分布式部署

Hadoop 3.2.4 本机伪分布式安装

阿尼古

07-12

890

基本上操作步骤跟2.x的版本内容差异不大，我的理解除了能力强了外，就是把默认的http端口改了，有点意外，安装完成验证的时候，用50070试了半天，还以为自己安装错了呢，原来调整为了9870端口。在此不再多bb了。

基于hadoop3.2.4安装hive3.1.1设置mysql元数据库管理

qq_41787146的博客

07-10

237

设置hadoop代理用户core-site.xml（和元数据管理无关，和hiveserver2有关）这是因为 hive 内依赖的 guava.jar 和 hadoop 内的版本不一致造成的。官网下载： http://archive.apache.org/dist/hive/我这里数据库名写的hive。

macOS编译hadoop(3.2.4)的最佳实践

huangzhaobo的博客

07-15

388

macOS编译hadoop

ubuntu20.04.5 hadoop3.2.4伪分布式安装部署

qq_41268548的博客

06-20

1006

本文章记录了在ubuntu20.04.5中部署hadoop3.x伪分布式和hive的安装过程

hadoop@hadoop:/usr/local/flink$ ls lib | grep hadoop hadoop-mapreduce-client-core-3.2.4.jar hadoop@hadoop:/usr/local/flink$

最新发布

05-24

### Flink SQL 执行时因缺少 Hadoop 相关类导致的 `ExceptionInInitializerError` 和 `NoClassDefFoundError` 当在执行 Flink SQL 作业时遇到 `ExceptionInInitializerError` 并伴随 `NoClassDefFoundError: org/apache/hadoop/fs/FSDataOutputStream` 的问题，通常是因为某些必要的 Hadoop 类未被正确加载到 Flink 的运行环境中。以下是可能的原因以及解决方案： #### 原因分析 1. **缺失必要 JAR 包** 如果 `hadoop-common`, `hadoop-hdfs`, 或 `hadoop-mapreduce-client-core` 等核心依赖未被引入，则可能导致此类异常[^4]。 2. **JAR 包版本不匹配** 使用的不同组件（如 Flink, Hadoop）可能存在版本兼容性问题。如果使用的 Hadoop 版本与 Flink 不一致，可能会引发类加载失败的情况[^3]。 3. **classpath 配置不当** 即使所需的 JAR 已存在，但如果它们未被正确添加到 Flink 的 classpath 中，仍然会触发此错误[^1]。 --- #### 解决方案 ##### 方法一：手动添加 Hadoop 依赖至 Flink 可以通过修改 Flink 的配置文件或将所需 JAR 添加到指定目录来解决问题。 - **将 Hadoop JAR 放入 Flink lib 目录** 将 `hadoop-common`, `hadoop-hdfs`, 及 `hadoop-mapreduce-client-core` 等 JAR 文件复制到 Flink 安装路径下的 `lib` 目录中。 ```bash cp /path/to/hadoop-mapreduce-client-core-*.jar $FLINK_HOME/lib/ ``` - **验证是否存在冲突** 检查是否有重复或不同版本的 JAR 存在于 `$FLINK_HOME/lib` 下，若有则移除旧版或冗余项[^4]。 ##### 方法二：通过环境变量设置 Classpath 可以在启动脚本中显式声明 Hadoop 的 CLASSPATH 路径。 ```bash export HADOOP_CLASSPATH=$(hadoop classpath) ``` 随后重新启动 YARN session 或提交任务即可生效[^1]。 ##### 方法三：调整 Maven 构建文件 (适用于开发阶段) 对于基于 Maven 开发的应用项目，在项目的 `pom.xml` 中加入以下依赖项可确保编译期间包含所有必需库： ```xml <dependencies>  <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.4</version> </dependency>  <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-hdfs-client</artifactId> <version>3.2.4</version> </dependency>  <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-mapreduce-client-core</artifactId> <version>3.2.4</version> </dependency> </dependencies> ``` 注意保持所选 Hadoop 版本号 (`3.2.4`) 与实际集群部署的一致性。 --- ### 示例代码片段假设需要编写一段简单的 Java 程序测试连接远程 HDFS 是否正常工作，可以参考下面的例子： ```java import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; public class TestHDFSSetup { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs://namenode-host:8020"); FileSystem fs = FileSystem.get(conf); System.out.println(fs.exists(new Path("/"))); } } ``` 确保该程序能够成功运行后再尝试复杂场景下的集成操作。 --- ### 总结针对当前描述的现象——即由于缺乏特定 Hadoop 组件而导致初始化失败的问题，推荐优先采用方法一所述方式快速定位并修复；同时建议长期维护过程中建立统一管理机制以减少类似隐患的发生频率。