一.hbase rowkey设计的原则
遵循唯一性,散列,不应过长等原则
二.rowkey常用的设计
1.reverse反转
2.salt加盐
3.hash散列
三.hbase建表预分区,指定3个rowkey,分成4个region
在Hbase中,预分区是一种优化手段,用于在创建表时提前规划好Region的分布,以提高数据写入的效率和查询性能,同时避免数据分布不均导致的热点问题
为什么要预分区?
1.减少split操作:随着数据的增长,单个Region超过一定大小会触发split操作,会消耗资源并影响性能
2.平衡数据分布:通过预知数据的分布特性,更均匀地分配Region,避免数据倾斜和热点问题
3.提升写入性能:预分区能够使得数据初始写入时直接分散到多个Region,提高并行写入的能力
示例:
create 'phoenix2','cf1',SPLITS => ['key1','key5','key8']
describe 'phoenix2'