CDH5.16.2安装部署(一)准备工作

本文详细介绍了一种基于Hadoop的大数据集群部署方案,包括离线部署、云平台环境准备及集群节点初始化工作。涵盖了CM(serveragent主从架构)、JDK、MySQL等组件的版本与链接,以及防火墙、selinux、时区与时钟同步的配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、集群规划

离线部署:mysql cm( server agent 主从架构 ) parcel文件

规划:

hadoop001:mysql cm-server cm-agent nn snn dn rm nm zk

hadoop002:cm-agent dn nm broker zk

hadoop003:cm-agent dn nm broker zk

原则:

  1. 选择第一台  配置不是太强的做为  工具节点  mysql  cm-server  cm-agent
  2. 选择2台  专门做  大数据生态圈的主从架构的组件(HDFS  YARN  HBase)的  主角色
  3. datanode和nodemanager部署在同一台 ==> 数据本地化,dn是用来做存储的,nm是用来做计算的,部署在同一台,可以尽可能的使计算离数据更近一些。
  4. 其他非主从架构的组件的进程  随意部署  尽量在同一个机架

二、云平台集群环境准备

2.1 云平台需求:

  • 杭州 、可用区G
  • 2core、16G
  • centos、7.2 64位
  • 高效云盘 40G
  • 网络 默认
  • 公网宽带:按固定带宽 1M

2.2安装包

组件版本链接
JDKjdk-8u251-linux-x64.tar.gz

https://www.oracle.com/java/technologies/javase-downloads.html

MySQLmysql-5.7.11-linux-glibc2.5-x86_64.tar.gzhttps://downloads.mysql.com/archives/community/
MySQL驱动mysql-connector-java-5.1.47.tar.gzhttps://downloads.mysql.com/archives/c-j/
CM tar包cloudera-manager-centos7-cm5.16.2_x86_64.tar.gzhttp://archive.cloudera.com/cm5/cm/5/
parcel

CDH-5.16.2-1.cdh5.16.2.p0.8-el7.parcel

CDH-5.16.2-1.cdh5.16.2.p0.8-el7.parcel.sha1

manifest.json

http://archive.cloudera.com/cdh5/parcels/5.16.2/

 

三、集群节点初始化工作

3.1 命令

安装包上传目录

mkdir ~/cdh5.16.2

安装上传下载命令(上传时可历时增加带宽)

yum install lrzsz   

3.2 配置ip和域名映射关系

hadoop001

hadoop002

hadoop003

3.3 防火墙

建议:尽量关闭防火墙 (自己的机房、IDC托管的机器、云主机)

systemctl stop firewalld

systemctl disable firewalld

iptables -F

3.4关闭selinux

vi /etc/selinux/config

SELINUX=disable

3.5时区、时钟的同步 (云主机可忽略)

1) 时区

timedatectl --help 

timedatectl list-timezones

2) 时钟

安装ntp工具

yum install -y ntp

策略:选择第一台节点作为ntp主节点,从网络或本地同步时间,其他节点作为从节点,从主节点同步时间

a) 主节点:

vi /etc/ntp.conf

#time

server 0.asia.pool.ntp.org

server 1.asia.pool.ntp.org

server 2.asia.pool.ntp.org

server 3.asia.pool.ntp.org

#当外部时间不可用,使用本地硬件时间

server 127.127.1.0 iburst local clock

#允许哪些网段的机器来同步时间

restrict 网段.0 mask 255.255.255.0 nomodify notrap

# 开启ntp

systemctl start ntpd

# 查看ntp的状态

systemctl status ntpd

# 查看ntp的网络服务器

ntpq -p

b) 从节点

# 关闭ntp

systemctl stop ntpd

# 禁用ntp

systemctl disable ntpd

# 从主节点同步时间

ntpdate hadoop001

# 使用crontab每天凌晨定时同步主节点的时间

crontab -e

00 00 * * * ntpdate hadoop001

 

 

 

 

 

### Cloudera CDH 5.16.2 安装指南 #### 准备工作 确保操作系统环境已准备好,这里以 CentOS 7.7 和 VMware 虚拟机为例。安装前需确认硬件资源充足,并完成基本网络配置。 #### 下载所需文件 访问官方渠道获取对应版本的 Cloudera Manager 及其依赖项。对于特定版本如 CDH 5.16.2部署,建议直接从官方网站下载对应的 ISO 镜像或 tarball 文件[^1]。 #### 安装 Cloudera Manager Server 解压下载好的压缩包至 `/opt` 目录下,并创建软链接以便管理不同版本之间的切换: ```bash tar zxvf cm-5.16.2.tar.gz -C /opt/ ln -sfn /opt/cm-5.16.2/ /opt/cloudera-manager ``` 设置开机自启并将服务加入防火墙白名单: ```bash systemctl enable cloudera-scm-server.service firewall-cmd --add-service=cloudera-scm --permanent && firewall-cmd --reload ``` 启动 Cloudera Manager Server 并验证是否正常运行: ```bash /opt/cloudera-manager/etc/init.d/cloudera-scm-server start netstat -lntp | grep :7180 # 应显示监听状态 ``` #### 安装 Agent 组件 同样地,在所有目标节点上执行相同操作来安装 agent: ```bash tar zxvf cm-agent-5.16.2.tar.gz -C / systemctl enable cloudera-scm-agent.service ``` 通过 SSH 连接到各个节点并依次启动它们的服务: ```bash for i in $(seq 1 5); do \ ssh node$i "sudo systemctl start cloudera-scm-agent"; \ done; ``` #### Web 控制台初始化 打开浏览器输入 `http://<your_server_ip>:7180` 访问 web UI,默认用户名密码均为 admin/admin 。按照向导提示逐步完成集群搭建过程中的各项设定,包括但不限于选择合适的 Hadoop 发行版、定义数据存储位置以及指派各类角色给不同的物理机器等[^3]。 #### 升级 Spark 版本 如果希望保留原有 Spark 1.6.x 同时引入新特性,则可通过 Parcels 功能实现多版本共存。具体做法是从官网下载 spark2.2.0 parcel 包后上传至服务器,随后依照页面指示更新现有集群配置使之兼容新版引擎。 最后记得保存更改并对整个系统进行全面测试,确保切功能均能稳定运作后再投入生产环境中使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值