CDH集群离线部署(CM6.3.1 + CDH6.3.2 + CentOS7)

本文详细介绍如何使用Cloudera Manager (CM) 和 Cloudera’s Distribution Including Apache Hadoop (CDH) 安装和配置Hadoop集群。包括环境准备、安装步骤、配置流程及常见问题解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1原生Hadoop的问题

  1. 版本管理过于混乱
  2. 部署过程较为繁琐,升级难度较大
  3. 兼容性差
  4. 安全性低

1.2CDHCM(Cloudera Manager)

  1. CDH(Cloudera’s Distribution Including Apache Hadoop),是Hadoop众多分中的一种,由Cloudera公司维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可以直接用于生产环境。就是Hadoop等大数据安装包的第三方版本的集合,提供了Hadoop等大数据服务的安装包。
  2. CM(Cloudera Manager)提供了一个管理和监控Hadoop等大数据服务的web界面,能让我们方便安装大数据生态圈的大部分服务。

1.3Hadoop自动化部署和管理平台

主流的有Apache Ambari和Cloudera Manager,相对应的Hadoop的发行版为HDP和CDH。这种自动化部署平台的功能一般如下:

  1. 提供Hadoop大数据集群
  2. 管理Hadoop大数据集群
  3. 监控Hadoop大数据集群

PS:HDP的公司(hortonworks)已经被CDH公司(Cloudera)收购了

1.4Cloudera Manager架构

                

  1. Server:负责软件安装、配置,启动和停止服务,管理服务运行的群集。核心
  1. Agent:安装在每台主机上。负责启动和停止进程,配置,监控主机。
  1. Management Service:由一组执行各种监控,警报和报告功能角色的服务。图表的生成和管理
  1. Database:存储配置和监视信息。
  1. Cloudera Repository:软件由Cloudera 管理分布存储库。(有点类似Maven的中心仓库;在线安装(从中心仓库拉取)和离线安装(离线库)
  1. Clients:是用于与服务器进行交互的接口(API和Admin Console)

1.5CDH下载

官方下载地址:https://archive.cloudera.com

  1. CM下载

https://archive.cloudera.com/cm6/6.3.1/redhat7/yum/RPMS/x86_64/

                    

  1. CDH下载

https://archive.cloudera.com/cdh6/6.3.2/parcels/

               

注意:CDH的版本一定要和CM的版本对应

2.环境准备

使用VMware模拟多台主机,由于主机条件有限,只演示三台机器,配置如下:

主机名

系统

IP

内存

磁盘

cdh-1

Centos7

192.168.100.10

4G

60G

cdh-2

Centos7

192.168.100.20

2G

60G

cdh-3

Centos7

192.168.100.30

2G

60G

<
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小宇0926

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值