上一篇用 4000 字的长文介绍了 HBase 的各种重要的面试知识点,原理方面的讲解已经相当地全面了,但这里仍然需要再单独拿出一个章节的篇幅来写 HBase 另外一大块非常重要的内容 —— 调优,可见这块内容在面试过程占据的重要地位。在任何面试中,系统调优能力都是衡量优秀工程师的很重要的一个指标,所以各位同学们振奋一下精神,把下面的内容都吃透了,在面试的过程中才能从容应对。
本篇面试内容划重点:BLOOMFILTER、预分区、数据倾斜、rowkey 设计。
关于表参数的调优 ?
HBase 虽然没有字段信息也没有类型的限制,但是建表的时候还是有很多需要注意的地方的,合理地配置表信息可以使你写的程序更高效地使用 HBase 。
BLOOMFILTER 布隆过滤器
默认值为 NONE,布隆过滤器的作用是可以过滤掉大部分不存在目标查询值的 HFile(即略去不必要的磁盘扫描),可以有助于降低读取延迟。 配置方式: create 'table',{BLOOMFILTER =>'ROW |``ROWCOL``'}
- ROW,表示对 Rowkey 进行布隆过滤,Rowkey 的哈希值在每次写入行时会被添加到布隆过滤器中