Pivotal Greenplum 5.4特性简介

Pivotal Greenplum 5.4介绍


Pivotal Greenplum 是基于MPP架构的数据库产品,它可以满足下一代数据仓库对大规模的分析任务的需求。通过自动对数据进行分区以及多节点并行执行查询等方式,它使一个包含上百节点的数据库集群运行起来就像单机版本的传统数据库一样简单可靠,同时提供了几十倍甚至上百倍的性能提升。除了传统的SQL,Greenplum 还支持MapReduce,文本索引,存储过程等很多分析工具,所支持的数据量可以从上百GB到几百TB。


Greenplum 5.4.1可以从这里下载(https://network.pivotal.io/),文档在这里(https://gpdb.docs.pivotal.io/540/main/index.html),主页在这里(https://greenplum.org/),源代码在github(https://github.com/greenplum-db/gpdb)。


新特性支持


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Gpstop工具增强


gpstop增加了--host选项,如果Segment设置了镜像(mirror),gpstop可以在指定的主机上结束Greenplum数据库的Segment实例。当Primary节点被终止后,对应Mirror节点上的Segment实例升级为Primary节点。


在下列情况下Segment实例不会被终止:


  • 没有Mirror

  • Master或者standby master节点也在指定的host上

  • Primary和Mirror在同一个host上


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

PL/Container/Language 扩展


  • PL/Container在Redhat/CentOS上升级为正式功能,不再是实验功能

  • 优化了plcontainer工具,提高了易用性

  • 新函数 plcontainer_containers_summary() 可以显示当前运行的容器信息

  • PL/Container 的配置文件格式有改变,新老配置不兼容

  • 数据库的GUC参数log_min_messages可以控制PL/Container 的log行为


试验特性


Pivotal Greenplum是基于开源的greenplum-db发布的,它包含了正在开发中的很多激动人心的功能,任何针对这些功能的反馈都会推进我们改进相关功能,并在将来的版本中正式支持。Greenplum 5.4.0/5.4.1中有如下实验功能:


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

gpbackup/gprestore


gpbackup/gprestore工具提供了更好的备份和恢复的性能(相比于gpcrondump和gpdbrestore)。gpbackup在访问pg_class时只使用了共享锁(ACCESS SHARE),而不是排他锁,因此在备份的时候仍可以对其他表运行DDL操作,比如 CREATE, ALTER, DROP, TRUNCATE


gpbackup/gprestore升级到了alpha3版本,它采用单个文件保存数据库元数据。它的格式与alpha1和alpha2不再兼容


gpbackup支持了 -include-table schema.table 和 -exclude-table schema.table 参数来选择对哪些表执行备份操作


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Recursive CTE


CTE(Common Table Expressin)定义了一个可以在同一个查询里重复使用的临时表,可以大大简化SQL语句。Greenplum 5.1.0中CTE定义支持了recursive关键字,从而允许在CTE定义时可以递归的引用自己。


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

SUSE平台上基于Resource group的资源管理


由于内核版本限制,SUSE11上的cgroup无法提供Resource group运行所依赖的功能,SUSE12解决了启用cgroup以后引起的Greenplum性能问题。


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

PXF的增强


支持允许PXF向HDFS写文本和序列化文件


改变的功能


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Madlib 1.13更新


Madlib1.13支持Greenplum5.4,在升级到Madlib1.13时,需要注意先删除knn函数


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

默认参数调整


参数optimizer_join_arity_for_associativity_commutativity 的默认值增大为18。

这个参数限制在生成查询计划时,ORCA尝试使用的join交换律和结合律变换的数目。当前ORCA会只最多尝试18中变换组合。当一个查询有很多的join条件时,降低这个值会大大提高性能;但是这个值过低,会导致ORCA生成的次优的查询计划。需要注意的是当 optimizer_join_order 为query或者greedy时,optimizer_join_arity_for_associativity_commutativity是不起作用的。


与开源版的比较


商业版的Greenpum除了包含了开源版本的全部功能,此外还有以下增强的功能:


  • 打包安装及部署脚本

  • 支持了QuickLZ压缩算法

  • 图形界面的管理工具,Greenplum Commander Center

  • 内置的监控工具,Workload Manager

  • 基于SQL的文本检索引擎,GPText

  • Spark Connector 和 Gemfire Connector

  • DataDirect的ODBC和JDBC驱动


Greenplum 5.4.0的扩展组件


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Client端工具


f297aead-4af2-4455-9ec4-23079d96fc44.png


Greenplum数据库包括如下扩展组件:


  • Fuzzy字符串匹配

  • PL/Python

  • pgcrypto


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

扩展模块


99ba9ca7-7796-4c01-87d3-37416795b0ed.png


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

其他扩展


  • PXF Extension Framework


Greenplum 5.x中引进新的外部数据框架PXF(Pivotal extention framework),它部署在每个运行Segment的物理机器上,提供了对HDFS文件系统以及HIVE的支持。PXF对外部数据提供了抽象的接口,可以方便的支持各种数据源


  • Greenplum-Spark Connector


支持Greenplum与Spark之间的高速并行数据传输


  • Gemfire-Greenplum Connector


支持Greenplum与Gemfire之间的高速并行数据传输


  • Pivotal GPText


Pivotal Greenplum Database 5可以支持  GPText version 2.1.3 及以后的版本。GPText是Greenplum提供的文本搜索引擎,可以支持全文检索及文本分析功能


Greenplum 5.4.0支持的平台


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

平台支持概述


  • Greenplum数据库只支持XFS文件系统,任何其它文件系统Pivotal都不提供支持

  • Greenplum数据库可运行在配有本地存储的1U或者2U兼容服务器上

  • Greenplum数据库支持网络或共享磁盘,共享磁盘需要作为块设备挂载,并采用XFS的分区方式

  • Greenplum数据库可以运行在虚拟机中,并且支持XFS的虚拟磁盘

  • Pivotal只支持10Gbit以上的以太网卡

  • Greenplum数据库可以运行在AWS上,磁盘需要使用AWs的instance store或者EBS存储

  • RHEL 7.2和7.3中systemd的RemoveIPC=yes选项会导致gpinitsystem失败


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Greenplum的服务器支持如下平台


  • Red Hat Enterprise Linux 64-bit 7.x

  • Red Hat Enterprise Linux 64-bit 6.x

  • SuSE Linux Enterprise Server 64-bit 11 SP4

  • SuSE Linux Enterprise Server 64-bit 12 SP2SP3 (内核版本大于4.4.73-5)

  • CentOS 64-bit 7.x

  • CentOS 64-bit 6.x


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

DELL EMC DCA支持


Greenplum 5.4支持DCA3.4及以上版本,DCA只支持企业版的Greenplum,不支持开源版Greenplum。Greenplum 5.0和5.1不支持DCA上的FIPS功能。


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Greenplum的java组件依赖java的如下版本


8.xxx

7.xxx


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Greenplum运行时需要如下的依赖包


  • OpenSSL 1.0.2l (with FIPS 2.0.16)

  • cURL 7.54

  • OpenLDAP 2.4.44

  • Python 2.7.12


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

Client端工具可以支持如下平台


  • Red Hat Enterprise Linux 64-bit 7.x

  • Red Hat Enterprise Linux 64-bit 6.x

  • CentOS 64-bit 7.x

  • CentOS 64-bit 6.x

  • AIX 7.2 (64-bit) (Client and Load Tools only)

  • SuSE Linux Enterprise Server x86_64 SLES 11

  • Windows 10 (32-bit and 64-bit)

  • Windows 8 (32-bit and 64-bit)

  • Windows Server 2012 (32-bit and 64-bit)

  • Windows Server 2012 R2 (32-bit and 64-bit)

  • Windows Server 2008 R2 (32-bit and 64-bit)


beff3f8f-bf4f-4559-9ce5-06e77afe99fc.png

PXF支持如下Hadoop平台


  • Cloudera

  • Hortonworks Data Platform

  • generic Apache Hadoop distributions



本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值