本章将介绍如何快速安装部署 Greenplum,以及 Greenplum 的一些常用命令及工具。本章不会涉及硬件选型、操作系统参数讲解、机器性能测试等高级内容,这些会在 “第8章 Greenplum 线上环境部署” 中介绍。
2.1 软件安装及数据库初始化
下面先介绍如何搭建一个完整的 Greenplum 环境。在搭建环境之前,我们必须对 Greenplum 的架构有一定的了解,并且准备好安装部署的机器,机器硬件、操作系统的安装配置读者可自行完成。
2.1.1 Greenplum 架构
在安装数据库的时候,我们先要对 Greenplum 架构有一定的了解,这样可以对数据库的安装和使用起到一个指导性的作用。同时在搭建 Greenplum 环境的过程中,可以加深对 Grenplum 架构的理解。 Greenplum 总体架构构图如图 2-1 所示。

下面介绍每个部件的主要功能,如表 2-1 所示。
表 2-1 Master 主机与 Segment 主机对比
| Master 主机 | Segment 主机 |
|---|---|
| 建立与客户端的会话连接和管理 | 业务数据的存储和存取 |
| SQ L的解析并形成分布式的执行计划 | 执行由 Master分发的SQL语句 |
| 将生成好的执行计划分发到每个 Segment 上执行 | 对于 Master来说,每个 Segment都是对等的,负责对应数据的存储和计算 |
| 收集 Segment 的执行结果 | 每一台机器上可以配置一到多个 Segment |
| Master 不存储业务数据,只存储数据字典 | 由于每个 Segment 都是对等的,建议采用相同的机器配置 |
| Master主机可以一主一备,分布在两台机器上 | Segment 分 primary 和 mirror 两种,一般交错地存放在子节点上 |
| 为了提高性能,Master 最好单独占用一台机器 | ... |
通过图 2-2 可以看出 Master 与 Segment 的关系。

Master 和 Segment 其实都是一个单独的 PostgreSQL 数据库。每一个都有自己单独的套元数据字典,在这里, Master 节点一般也叫主节点, Segment 也叫做数据节点。
Segment 节点与 Master 节点的通信,通过千兆(或万兆)网卡组成的内部连接(InterConnect),在同一台数据节点机器上可以放多个 Segment,不同的 Segment 节点会被赋予不同的端口,同时, Segment 之间也不断地进行着交互。为了实现高可用,每个 Segment 都有对应的备节点( Mirror Segment),分别存在于不同的机器上。
Client 一般只能与 Master 节点进行交互, Client 将 SQL 发给 Master,然后 Master 对 SQL 进行分析后,再将其分配给所有的 Segment 进行操作,并且将汇总结果返回给客户端。
2.1.2 环境搭建
1. 安装 Linux
Greenplun 没有 Windows 版本,只能安装在类 UNIX 的操作系统上。
2. Greenplum 集群规划
| 节点 | IP | 内存 | 硬盘 |
|---|---|---|---|
| mdw | 192.168.2.101 | 512M | 8G |
| sdw1 | 192.168.2.102 | 512M | 8G |
| sdw2 | 192.168.2.103 | 512M | 8G |
机器对应的 Master 和 Segment 如下分配:192.168.2.101 作为 Master 节点,192.168.2.102~103 作为 Segment 节点,每个机器上配置两个 Primary Segment 和两个 Mirror Segment;同时 192.168.2.103 作为 Master Standy 节点。通过图 2-3 的架构图可以清晰地知道我们所搭建的集群的概况。
4. 网络(hosts)
在确定机器配置的时候,要保证所有机器的网络都是通的,并且每台机器的防火墙都是关闭的,避免存在网络不通的问题。
在配置 /etc/hosts 时,习惯将 Master 机器叫做 mdw,将 Segment 机器叫做做 sdw,配置好后,使用 ping 命令确定所有 hostname 都是通的。
5. 创建用用户及用户组
创建 gpadmin 用户及用户组,将其作为安装 Greenplum 的操作系统用户。
# 删除原有的用户组及用户
groupdel gpadmin
userdel gpadmin

本文详细介绍了Greenplum数据库的快速安装部署流程,包括软件安装、数据库初始化配置、环境变量设置、存储区域创建、系统时间同步及数据库启动停止等关键步骤。同时,文章还分享了在部署过程中可能遇到的问题及解决方案。
最低0.47元/天 解锁文章
2820

被折叠的 条评论
为什么被折叠?



