南大通用大规模分布式并行数据库集群系统,简称:GBase 8a MPP Cluster,它是在GBase 8a列存储数据库基础上开发的一款Shared Nothing架构的分布式并行数据库集群,具备高性能、高可用、高扩展等特性,可以为各种规模数据管理提供高性价比的通用计算平台,并广泛用于支撑各类数据仓库系统、BI系统和决策支持系统。
GBase 8a MPP Cluster具有联邦构架、大规模并行计算、海量数据压缩、高效存储结构、智能索引、虚拟集群及镜像、灵活的数据分布、完善的资源管理、在线快速扩展、高并发、高可用性、高安全性、易维护、高效加载等技术特征,具体如下:
- 联邦架构:基于列存储的完全并行的MPP + Shared Nothing的联邦架构,采用多活Coordinator节点、运算节点的两级部署结构,避免了单点性能瓶颈和单点故障。Coordinator节点支持最多部署64个;同一物理集群数据节点支持部署1000个以上;集群支持海量数据存储、查询,单个物理集群支持100PB以上的结构化数据;
- 大规模并行计算:通过采用MPP技术的计划器,基于规则和基于代价的优化器,基于异步IO技术的调度器,支持高并发、高可靠、大规模的并行调度。
- 海量数据压缩存储:采用hash、random及replicate的分布策略进行数据分布式存储;同时采用先进的压缩算法,减少存储数据所需的空间,并相应地提高I/O性能;支持实例级、表级、字段级三级压缩;支持基于列存储的数据编码及高效压缩技术;压缩比可达1:20以上;
- 高效存储结构:采用基于列存储、适合分析优化的存储结构;支持行列混合存储的存储结构,有效提高列存数据库在sele