kudu+impala 使用手册

本文介绍了技术路线从Oracle到Kafka-Kudu,并详细阐述了Kudu和Hive、Hbase的优缺点。Kudu以其快速分析和实时计算能力成为选择,尤其在大表查询速度上的优势。文章提到了通过Kafka消费者将数据直接写入Kudu表,并用Impala处理中间逻辑表。同时,提供了Impala和Kudu建表及查询的示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.技术路线

oracle--kafka-kudu

2.各个组件优缺点

Hive:数据直接存放于hdfs中,适合离线分析,确不利于记录级别的随机读写。

Hbase:将数据存放再hbase中,适合记录级别的随机读写。对离线分析确不友好。

Kudu:是对 hdfs 和 hbase 功能上的补充,能提供快速的分析 和实时计算能力

Kudu 特性:

kudu 面向结构化存储 支撑单行事务

   不允许用户数据的primary key重复

   底层直接采用本地文件系统parquet 列式存储格式

   设计既兼顾了分析型查询,又兼顾了随机读写的能力 primary key 的唯一性 限制了写入的时延性

突出优点就是:大表上亿条数据,查询速度快  

   缺点:写的性能比较慢

为了充分利用kudu 的优点 将接口表全部建成kudu 表 通过kafka

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值