OushuDB 的主要功能

介绍了一种高效执行器,其性能远超传统数仓/MPP和HadoopSQL引擎。该执行器支持公有云和私有云部署,具备完善的ANSI SQL支持、强大的并行优化能力、ACID事务特性,并采用动态数据流引擎实现高速互联。此外,还支持多种分区方法、压缩方法和存储过程语言。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

极速执行器: 高效的执行器,比传统数仓/MPP快5-10倍,比Hadoop SQL引擎要快5-30倍。

公有云和私有云部署:支持亚马逊和阿里云等公有云平台,同时可以支持主流PaaS云平台(比如Kubernetes等)和Docker部署。

对标准的完善支持:ANSI SQL标准,OLAP扩展,标准JDBC/ODBC,比Hadoop SQL引擎都要完善。

具有非常成熟的并行优化器。优化器是并行SQL引擎的重要组成部分,对性能影响很大,尤其是对复杂查询。

支持ACID事务特性:这是很多现有基于Hadoop的SQL引擎做不到的,对保证数据一致性很重要。可以有效减少开发及运维人员的负担。

动态数据流引擎:基于UDP的高速互联网络。

弹性调度执行:可以根据查询大小来决定执行查询使用的节点及Segment个数。

支持多种分区方法及多级分区:支持List分区和Range分区。分区表对性能有很大提升作用,如果用户只想访问最近一个月的热数据,查询只需要扫描最近一个月数据所在分区。

支持多种压缩方法:snappy,gzip,zlib, zstd, lz4, RLE等。

多种存储过程语言支持:python, c/c++, perl等。

动态扩容:动态按需扩容,按照存储大小或者计算需求,秒级添加节点。

多级资源和负载管理:和外部资源管理器YARN集成;可以管理CPU,Memory资源等;支持多级资源队列;具有方便的DDL管理接口。

支持访问任何HDFS及其他系统的数据:各种HDFS格式(文本,ORC等等)以及其他外部系统(Hive等),并且用户自己可以开发插件来访问新的数据源。

原生的机器学习数据挖掘库MADLib支持:易于使用及高性能。

与Hadoop系统无缝集成:存储、资源、安装部署、数据格式和访问等。

完善的安全及权限管理:kerberos;数据库,表等各个级别的授权管理。

支持多种第三方工具:比如Tableau,SAS,较新的Apache Zeppelin等。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值