前言
从事大数据方向的程序员 应该都对CDH比较熟悉,这是一款市场上比较好用的免费的数据平台系统,在CDH上我们可以安装部署兼容的hadoop sprk zookeeper kafka等常用的大数据服务,虽然现在暂不支持flink,将来兼容一定是大势所驱。
这篇博客我们要讲的是CDH中自带的一个非常重要的负责监控和管理各个数据服务的服务-Cloudera Manager,对于很多人来说 对这个应该不陌生。
一般而言,cloudera manager都采用的单点模式,即部署单个server 单点service。 但是在一个集群作业特别繁忙的场景中,为了提高Cloudera Manager的高可靠性,我们最好部署Cloudera Manager HA(主从server 主从service)来提高系统的高可靠性。
Cloudera Manager HA模式搭建
1.设置主机和负载平衡器
在一个高水平,在单独的主机上设置Cloudera Manager Server和Cloudera Management Service 角色(包括Cloudera Navigator),并确保通过配置的负载平衡器对来自其他Cloudera服务和管理控制台的主机进行网络访问。
它主要分为4步:
1.为主服务器和辅助服务器创建主机
2.设置负载均衡器
3.设置数据库
4.设置NFS服务器
Cloudera Manager Server,Cloudera Navigator以及使用关系数据库的所有Cloudera Management Service角色都应使用位于主机外的外部数据库服务器。您必须确保将这些数据库配置为高可用性。(这里说明一下:因为之前公司内部应用的CM 单点 数据库都是搭建在集群内部,所以这类并没有使用外部数据库服务器)
数据库高可用的实质就是配置一个MySQL主从复制的服务器
1.1 MySQL互为主从复制以及负载均衡的配置
具体过程前面有一篇博客已经讲述。
3. haproxy负载均衡mysql
这里我们选择在主机172.17.17.92安装
- yum install haproxy
2.修改配置
vi /etc/haproxy/haproxy.cfg
添加配置
listen mysql
bind 0.0.0.0:3306
mode tcp
option tcplog
balance leastconn
server 172.17.17.21 172.17.17.21:3306 check
server 172.17.17.25 172.17.17.25:3306 check
3启动
在解压目录下执行haproxy -f /etc/haproxy/haproxy.cfg
关于配置其他CM Service角色(例如 Service Monitor和Host Monitor角色),这些角色使用文件支
关于配置其他CM Service角色(例如 Service Monitor和Host Monitor角色),这些角色使用文件支持的存储机制将其存储在共享NFS存储机制上。
1.2 为主从server服务器选定主机
Cloudera建议为Cloudera Manager服务使用四台主机。所有这些主机必须正确解析正向和反向DNS查找:
Cloudera Manager Server主要主机(主机名: CMS1 [147])
Cloudera Management Service主要主机(主机名: MGMT1 [148])
Cloudera Manager Server辅助主机(主机名: CMS2 [145])
Cloudera Management Service辅助主机(主机名: MGMT2 [146