Pivotal Greenplum 5.5 于2018年2月18日正式发布,让我们通过这篇文章带你走进5.5的新特性。
Pivotal Greenplum 5.5介绍
Pivotal Greenplum是基于MPP架构的数据库产品,它可以满足下一代数据仓库对大规模的分析任务的需求。通过自动对数据进行分区以及多节点并行执行查询等方式,它使一个包含上百节点的数据库集群运行起来就像单机版本的传统数据库一样简单可靠,同时提供了几十倍甚至上百倍的性能提升。除了传统的SQL,Greenplum还支持MapReduce,文本索引,存储过程等很多分析工具,所支持的数据量可以从上百GB到几百TB。
Greenplum 5.5.0可以从这里下载(https://network.pivotal.io/),文档在这里(https://gpdb.docs.pivotal.io/550/main/index.html),主页在这里(http://greenplum.org/),源代码在github(https://github.com/greenplum-db/gpdb)。
新特性支持
Greenplum'新的备份和恢复工具gpbackup/gprestore在从实验特性变为正式支持的功能。gpbackup/gprestore工具提供了更好的备份和恢复的性能及更高的可靠性(相比于gpcrondump和gpdbrestore)。它们从Greenplum 5.2版本开始作为实验特性就已经加入到了Greenplum的企业版发布中。gpbackup在访问pg_class时只使用了共享锁(ACCESS SHARE),而不是排他锁,因此在备份的时候仍可以对其他表运行DDL操作,比如 CREATE, ALTER, DROP, TRUNCATE,只要这些操作不影响正在执行备份操作的表。
Greenplum 5.5中的gpbackup和gprestore包含如下增强及改动:
增强的邮件通功能
Gpbackup和gprestore可以返回不同的状态码来表示备份的结果
Gprestore增加了如下的选项
-exclude-schema 从恢复操作中排除指定schema
-exclude-table 从恢复操作中排除指定表
-exclude-table-file 从文件中读取需要忽略的表
-include-table 从备份中恢复指定的表
gprestore的-j参数增加了并行的索引恢复的支持
可以在gpbackup/gpresotre的文档(https://gpdb.docs.pivotal.io/550/admin_guide/managing/backup-gpbackup.html#topic_yrr_hqw_sbb)中看到更详细的信息。
Gpload的配置文件增加了preload:staging_table字段,可以用来指定加载时创建的外部表的表名。当允许reuse参数为true时,gpload通过这个字段直接找到可重用的外部表明,从而避免从pg_class查找。
PXF现在可以使用登陆用户的身份执行数据访问操作,之前只能使用gpadin身份
PXF支持了读取HDFS上的Parquet文件
支持允许PXF向HDFS写文本和序列化文件
Greenplum的workload management扩展从5.5开始加入到Greenplum的发行版,主要是是为后续的Greenplum command center提供监控及管理功能。
试验特性
Pivotal Greenplum是基于开源的greenplum-db(https://github.com/greenplum-db/gpdb)发布的,它包含了正在开发中的很多激动人心的功能,任何针对这些功能的反馈都会推进我们改进相关功能,并在将来的版本中正式支持。Greenplum 5.5.0中有如下实验功能:
CTE(Common Table Expressin)定义了一个可以在同一个查询里重复使用的临时表,可以大大简化SQL语句。Greenplum 5.1.0中CTE定义支持了recursive关键字,从而允许在CTE定义时可以递归的引用自己。
由于内核版本限制,SUSE11上的cgroup无法提供Resource group运行所依赖的功能,SUSE12解决了启用cgroup以后引起的Greenplum性能问题。
改变的功能
PXF的默认服务端口从51200改为5888
gpbackup的参数选项名称改变
-backupdir改为-backup-dir
Gprestore的参数选项名称改变
-backupdir 改为 -backup-dir
-createdb 改为 -create-db
-redirect 改为 -redirect-db
-globals 改为 -with-globals
Gpdeletesystem工具会从backups目录以及db_dumps目录搜索备份文件,老的版本只会从db_dumps目录搜索
支持了新版本的PostGIS扩展
移除的功能
老的备份和恢复工具,gpcrondump和gpdbrestore将被移除,5.x生命周期以后将不再支持。
与开源版的比较
商业版的Greenpum除了包含了开源版本的全部功能,此外还有以下增强的功能:
打包安装及部署脚本
支持了QuickLZ压缩算法
图形界面的管理工具,Greenplum Commander Center
内置的监控工具,Workload Manager
基于SQL的文本检索引擎,GPText
Spark Connector 和 Gemfire Connector
DataDirect的ODBC和JDBC驱动
Greenplum 5.5.0的扩展组件
Client端工具
Greenplum数据库包括如下扩展组件:
Fuzzy字符串匹配
PL/Python
pgcrypto
扩展模块
其他扩展
PXF Extension Framework
Greenplum 5.x中引进新的外部数据框架PXF(Pivotal extention framework),它部署在每个运行Segment的物理机器上,提供了对HDFS文件系统以及HIVE的支持。PXF对外部数据提供了抽象的接口,可以方便的支持各种数据源
Greenplum-Spark Connector
支持Greenplum与Spark之间的高速并行数据传输
Gemfire-Greenplum Connector
支持Greenplum与Gemfire之间的高速并行数据传输
Pivotal GPText
Pivotal Greenplum Database 5可以支持 GPText version 2.1.3 及以后的版本。GPText是Greenplum提供的文本搜索引擎,可以支持全文检索及文本分析功能。
Greenplum 5.5.0支持的平台
平台支持概述
Greenplum数据库只支持XFS文件系统,任何其它文件系统Pivotal都不提供支持
Greenplum数据库可运行在配有本地存储的1U或者2U兼容服务器上
Greenplum数据库支持网络或共享磁盘,共享磁盘需要作为块设备挂载,并采用XFS的分区方式
Greenplum数据库可以运行在虚拟机中,并且支持XFS的虚拟磁盘
Pivotal只支持10Gbit以上的以太网卡
Greenplum数据库可以运行在AWS上,磁盘需要使用AWs的instance store或者EBS存储
RHEL 7.2和7.3中systemd的RemoveIPC=yes选项会导致gpinitsystem失败
Greenplum的服务器支持如下平台
Red Hat Enterprise Linux 64-bit 7.x
Red Hat Enterprise Linux 64-bit 6.x
SuSE Linux Enterprise Server 64-bit 11 SP4
SuSE Linux Enterprise Server 64-bit 12 SP2SP3 (内核版本大于4.4.73-5)
CentOS 64-bit 7.x
CentOS 64-bit 6.x
Greenplum 5.4支持DCA3.4及以上版本,DCA只支持企业版的Greenplum,不支持开源版Greenplum。Greenplum 5.0和5.1不支持DCA上的FIPS功能。
8.xxx
7.xxx
Greenplum运行时需要如下的依赖包
OpenSSL 1.0.2l (with FIPS 2.0.16)
cURL 7.54
OpenLDAP 2.4.44
Python 2.7.12
Client端工具可以支持如下平台
Red Hat Enterprise Linux 64-bit 7.x
Red Hat Enterprise Linux 64-bit 6.x
CentOS 64-bit 7.x
CentOS 64-bit 6.x
AIX 7.2 (64-bit) (Client and Load Tools only)
SuSE Linux Enterprise Server x86_64 SLES 11
Windows 10 (32-bit and 64-bit)
Windows 8 (32-bit and 64-bit)
Windows Server 2012 (32-bit and 64-bit)
Windows Server 2012 R2 (32-bit and 64-bit)
Windows Server 2008 R2 (32-bit and 64-bit)
Cloudera
Hortonworks Data Platform
generic Apache Hadoop distributions
如果在Cloudera平台需要JSON格式的支持,PXF依赖cloudera 5.8以上的版本。
本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。