Sqoop新增批量导入HBase功能

本文介绍了一种在Sqoop 1.4.3基础上新增的功能,该功能通过调用LoadIncrementalHFiles.doBulkLoad实现更高效的HBase数据批量加载,相比原有HTable.put接口的方式,能显著提高在HBase集群压力下的数据导入速度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Sqoop导入HBase的实现是直接调用HBase的HTable.put接口,在HBase集群有压力的情况下,这个导入方式是相当慢的。到底有多慢,可以参考一下我写的一篇文章:批量Load到HBase

 

因此,我在Sqoop 1.4.3的基础上,添加了一种调用LoadIncrementalHFiles.doBulkLoad的bulk load功能。已经把patch提供给社区, https://issues.apache.org/jira/browse/SQOOP-1032

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值