第一章 - 引言
CDH(Cloudera's Distribution Including Apache Hadoop)是一套基于 Apache Hadoop 的大数据解决方案,提供了分布式存储和计算能力。在本文中,我们将详细介绍如何离线部署 CDH 5.12.1,并搭建一个 Hadoop 集群服务,帮助你快速搭建大数据处理平台。
第一节 - 准备工作
步骤一:下载 CDH 5.12.1 安装包
首先,你需要从 Cloudera 官方网站(https://www.cloudera.com/)下载 CDH 5.12.1 的离线安装包。
步骤二:准备服务器
在搭建 Hadoop 集群之前,你需要准备一组服务器。确保这些服务器能够相互通信,并且满足 Hadoop 的硬件和操作系统要求。
第二节 - 离线部署 CDH 5.12.1
步骤一:上传安装包
将下载的 CDH 5.12.1 安装包上传到所有服务器的相同目录下。
步骤二:解压安装包
在所有服务器上执行以下命令,解压 CDH 5.12.1 安装包:
$ tar -xzvf CDH-5.12.1.tar.gz
步骤三:安装依赖包
在所有服务器上执行以下命令,安装 CDH 5.12.1 所需的依赖包:
$ sudo yum install -y java-1.8.0-openjdk-devel $ sudo yum install -y mysql-connector-java
步骤四:配置主机名
在所有服务器上执行以下命令,配置主机名:
$ sudo hostnamectl set-hostname <hostname>
其中 <hostname> 是服务器的主机名。
步骤五:设置 hosts 文件
在所有服务器上执行以下命令,编辑 /etc/hosts 文件:
$ sudo vi /etc/hosts
添加所有服务器的 IP 地址和主机名:
<server1_IP> <server1_hostname> <server2_IP> <server2_hostname> ...
保存并退出文件。
第三节 - 部署 Hadoop 集群服务
步骤一:配置 SSH 免密登录
在其中一台服务器上执行以下命令,生成 SSH 密钥并将其分发到其他服务器上:

最低0.47元/天 解锁文章
1620

被折叠的 条评论
为什么被折叠?



