最近使用到hbase做存储,发现使用scan的时候,返回的rowkey并不是特别友好
例如我insert的rowkey是 xyz_123_abc
调用KeyValue的getKeyString方法返回的String为
- kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04
kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04
可以看到我的rowkey已经被处理过了,不过这个处理只是拼接处理,没有其他译码的过程。
好吧,这下需要考虑如何提取出我的真实的rowkey了,看了下KeyValue中,生成key的算法太繁琐了,直接跳过,debug看下rowkey的返回过程,发现KeyValue对象本身其实是正常的,也就是说KeyValue的toString方法其实有正常的rowkey,ok找到入口点了,直接看toString的方法

在使用HBase进行数据存储时,通过Scan操作获取RowKey时,发现原始插入的RowKey被处理成了一种特定格式。经过分析,发现处理仅涉及简单的拼接,并未进行译码。通过深入研究KeyValue类,发现在其toString方法中可以找到原始RowKey。通过跟踪keyToString方法,了解RowKey的构造方式,并编写了一个Util方法来提取真实RowKey。



最低0.47元/天 解锁文章
4293

被折叠的 条评论
为什么被折叠?



