写在前面: 我是
「nicedays」
,一枚喜爱做特效,听音乐,分享技术的大数据开发猿
。这名字是来自world order乐队的一首HAVE A NICE DAY
。如今,走到现在很多坎坷和不顺,如今终于明白nice day是需要自己赋予的。
白驹过隙,时光荏苒,珍惜当下~~
写博客一方面是对自己学习的一点点总结及记录
,另一方面则是希望能够帮助更多对大数据感兴趣的朋友。如果你也对大数据与机器学习
感兴趣,可以关注我的动态https://blog.youkuaiyun.com/qq_35050438
,让我们一起挖掘数据与人工智能的价值~
文章目录
HBase调优:
Region管理:
Region拆分
- 当一个Region大到一定程度,会进行(split)
- HBase可以通用Region Split 达到负载均衡
Region合并
- 如果删除了大量数据,很多region变小,这个时候region多个就会很浪费
Region拆分:
自动拆分:
- constantSizeRegionSplitPolicy
- IncreasingToUpperBoundRegionSplitPolicy(默认)
Math.min(tableRegionCounts ^ 3 * initialSize,defaultRegionMaxFileSize)
tableRegionCounts 就是字面意思
initialSize 默认为memstore2倍
defaultRegionMaxFileSize :region最大大小。默认10G
假设只有一个region,memstore是128M,10g
min(1 ^ 3 * 2 * 128, 10G) = 256M
也就是当达到256M时,就会拆分
同理2个region时,当每个region达到2G时会拆分
3个region时