greenplum + pgsql和Hadoop+hive+hbase

本文对比了Hadoop+Hive+hbase与GreenPlum+PostgreSQL两种架构的特点。Hadoop支持新增节点且无需重启,适用于大规模数据处理,而GreenPlum则更侧重于传统BI工具的支持。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在做的项目用的架构是greenplum+postgresql,Hadoop+Hive+hbase模式

 

 A. Hadoop + Hive 
支持新增节点,过程中不需要重启
支持jdbc访问hive数据库
支持sql的方式获取数据
在技术过程中,数据是以批量的方式来执行。如果Hadoop集群中架设了tez引擎,则计算数据会提高不少
如果想支持即席查询,则需要drill,impala组件辅助
集群规模可达到上万
容灾性比较好,一两台机器出现问题不影响整体
可视化工具方面比较少,常用hue,zepplin等
能与当前的Hadoop生态其他组件完全融合,有很多弹性的选择。
开源生态最健壮

B. GreenPlum + PostGreSQL
支持新增节点,但过程中需要重启
集群规模很少有上千的,一般都是几十上百台
支持jdbc访问数据库
支持sql的方式获取数据
支持即席查询
与当前的传统BI工具可很好的结合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值