HBase 中RowKey的设计原则

最新推荐文章于 2024-06-16 01:19:29 发布

原创最新推荐文章于 2024-06-16 01:19:29 发布 · 1.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

HBase 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了在设计RowKey时应遵循的原则，包括确保字段有意义、采用定长字段以便于范围查询、利用左前缀提高查询效率及按时间降序排列RowKey的方法等。

1、应当尽量将需要查询的信息存储在行健中，并且越靠左的字段其选择性越高（与MySQL中的建立的多列索引，支持左前缀索引，因此越靠左的字段选择性越高）

2、为了让所有字段都有意义，并且在特定的位置表示特定的字段，建议将每个字段设置为定长（不够的补0），这种定长的好处在范围查询中能够体现出来。

3、根据左前缀进行组合字段必须都有意义

比如：

当我们设计的RowKey类型为：

<userI>-<date>-<messageId>-<attachmentId>

则需要让组合字段的各个左前缀都有意义：

RowKey 描述

<userId> 扫描一个给定用户ID下的所有信息

<userId>-<date> 扫描一个给定用户ID下特定日期下的全部消息

<userId>-<date>-<messageId> 扫描一个给定用户ID和日期下的指定消息的所有附件信息

<userId>-<date>-<messageId>-<attache> 扫描一个给定用户ID和日期下以及给定消息和给定附件的具体内容

根据上面设计的格式，在实际要查询的时候（和MySQL的多列索引的查询方式类似）,最左的字段我们可以自定为常量，在其之后加上范围查询。

4、让RowKey按时间降序排列的方法

（1）时间戳转为位，再按位取反

（2）LONG.MAX_VALUE-<date-as-long>

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。