Greenplum数据库集成了三种服务器:主服务器,段服务器和ETL服务器。 Greenplum数据库服务器必须符合以下标准。
通常是1U服务器
与段服务器相同的处理器,RAM,RAID卡和NICs 卡
将6到10个磁盘(最常见的8个)组织到一个RAID5组中,并配置一个热备份
SAS 15k磁盘首选,10k磁盘紧随其后
所有磁盘必须具有相同的大小和类型
最多可以抽取400W左右
gpcheckperf的读取速度应该在500 MB / s或更高(Master扫描速度越快,生成查询计划的速度越快,可以提高整体性能)
应该能够在gpcheckperf中写入500 MB / s或更高的写入速率
应包含足够的附加网络接口,以便能够以客户所期望的方式直接将其连接到客户网络
通常是2U服务器
最快的可用处理器
64 GB RAM或更多
一个或两个具有最大高速缓存和高速缓存保护的RAID卡(闪存或电容器优于电池)
2x10Gb
将12到24个磁盘组织到一个由6到8个磁盘组成的RAID5组中(没有配置热备份)(除非在RAID组构建后有可用的磁盘)
SAS 15k磁盘首选,10k磁盘紧随其后。 如果无法使用SAS 15k或SAS 10k,则SATA磁盘优先于NearlineSAS。 所有磁盘必须具有相同的大小和类型。
最多可以抽600W左右
gpcheckperf中的最小读取速率为900 MBPS或更高(典型值为2000 MB / s)
gpcheckperf中的最小写入速率为1,000 MB / s或更高(典型值为1200 MB / s)
ETL Servers
通常是2U服务器
与段服务器相同的处理器,RAM和互连NIC
一个或两个具有最大高速缓存和高速缓存保护的RAID卡(闪存或电容器优于电池)
将12到24个磁盘组织到一个由6到8个磁盘组成的RAID5组中(没有配置热备份)(除非在RAID组构建后有可用的磁盘)
对于ETL而言,SATA磁盘是一个不错的选择,因为典型的性能不如存储这些系统的性能
最多可以抽600W左右
gpcheckperf中的读取速率应能达到100 MB / s或更高(ETL服务器扫描速度更快,可以加载更快的查询数据)
gpcheckperf中的写入速率应能达到500 MB / s或更高(ETL服务器写入速度更快,可加载更快的数据)
有关选择ETL服务器的其他技巧
ETL节点可以是任何提供足够的存储和性能来完成所需任务的服务器。 通常,每个群集需要4到8个ETL服务器。 最大数量取决于所需的负载性能和Greenplum数据库集群的大小。
例如,Greenplum数据库集群越大,负载可以越快。 ETL服务器越多,可以提供更快的数据。 拥有比集群更多的ETL带宽是毫无意义的。具有比群集少得多的ETL带宽可以获得比最大可能的负载更慢的负载。