hbase之scan的rowkey问题

在使用HBase进行数据存储时,通过Scan操作获取RowKey时,发现原始插入的RowKey被处理成了一种特定格式。经过分析,发现处理仅涉及简单的拼接,并未进行译码。通过深入研究KeyValue类,发现在其toString方法中可以找到原始RowKey。通过跟踪keyToString方法,了解RowKey的构造方式,并编写了一个Util方法来提取真实RowKey。

最近使用到hbase做存储,发现使用scan的时候,返回的rowkey并不是特别友好

 

例如我insert的rowkey是 xyz_123_abc

 

调用KeyValue的getKeyString方法返回的String为

 

Java代码 复制代码  收藏代码
  1. kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04  
kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04

 可以看到我的rowkey已经被处理过了,不过这个处理只是拼接处理,没有其他译码的过程。

 

好吧,这下需要考虑如何提取出我的真实的rowkey了,看了下KeyValue中,生成key的算法太繁琐了,直接跳过,debug看下rowkey的返回过程,发现KeyValue对象本身其实是正常的,也就是说KeyValue的toString方法其实有正常的rowkey,ok找到入口点了,直接看toString的方法

 

可以使用 HBase 中的 Reverse Scan(反向扫描)功能来实现按照 RowKey 前缀进行反向扫描。具体而言,你可以将 RowKey 前缀反转(Reverse Prefix),然后将反转后的前缀作为起始 RowKey,再将原始的 RowKey 前缀反转后作为终止 RowKey,然后进行反向扫描。 下面是一个示例代码: ``` byte[] reversePrefix = Bytes.toBytesBinary(new StringBuilder(Bytes.toStringBinary(prefix)).reverse().toString()); byte[] startRow = Bytes.add(reversePrefix, Bytes.toBytesBinary("0000000000000000")); byte[] stopRow = Bytes.add(reversePrefix, Bytes.toBytesBinary("ffffffffffffffff")); Scan scan = new Scan(startRow, stopRow); scan.setReversed(true); scan.setCaching(100); ResultScanner scanner = table.getScanner(scan); for (Result result : scanner) { // 处理结果 } scanner.close(); ``` 其中,`prefix` 为 RowKey 前缀,`table` 为 HBase 表对象。在代码中,首先将 RowKey 前缀进行反转,然后将反转后的前缀与起始和终止标识符进行拼接,得到起始和终止 RowKey。接着,创建一个反向扫描的 `Scan` 对象,设置起始和终止 RowKey、是否反向扫描以及缓存大小等参数。最后,通过 `table.getScanner()` 方法获取 `ResultScanner` 对象,遍历结果并进行处理。 需要注意的是,反向扫描需要对 RowKey 进行反转,因此可能会影响查询性能。此外,反向扫描也可能会影响数据的分布,因此需要根据具体情况进行选择。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值