Hbase优化

最新推荐文章于 2023-03-31 13:38:11 发布

原创最新推荐文章于 2023-03-31 13:38:11 发布 · 655 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

hbase 专栏收录该内容

5 篇文章

订阅专栏

1，预分区。因为第一次建表的时候会自动创建一个region分区.如果再倒入数据的话，因为一开始没有数据，不会split切分，这样会对单个region server造成比较大的io开销，所以需要预分区。预分区可以根据热点范围的rowkey来制定分区策略。

2，通过rowkey检索数据的时候，需要制定column，这个比较好理解，和关系型数据库的sql优化一样，select *　from table 需要制定查询的column.

3,rowkey长度不要太长，太长会浪费空间。

4，现在HBase并不能很好的处理两个或者三个以上的列族，所以尽量让你的列族数量少一些。目前，flush和compaction操作是针对一个Region。所以当一个列族操作大量数据的时候会引发一个flush。那些不相关的列族也有进行flush操作，尽管他们没有操作多少数据。Compaction操作现在是根据一个列族下的全部文件的数量触发的，而不是根据文件大小触发的。当很多的列族在flush和compaction时,会造成很多没用的I/O负载(要想解决这个问题，需要将flush和compaction操作只针对一个列族) 。

5,Time To Live 可以用该参数设置hbase里面存储的日志的实效时间。

6，major compaction 与minor compaction：

关于major compaction.1，关闭自动的major compaction 2手动编程major compaction.设置成晚上合并

一般不对minor compaction进行设置修改。

7，对于不太重要的数据写入hbase，可以关闭HLog的写入

8，Memstore实现了写缓存，Blockcache实现了读缓存，如果读比较多的话，可以设置该参数，这个参数是在create表的时候设置的。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。