HBase Filter介绍及执行流程

本文详细介绍了HBase过滤器的工作原理及其执行流程。过滤器在服务端执行,通过谓语下推减少网络传输负担。文章还对比了不同类型的比较器性能,并解释了过滤器实例的创建时机。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HBASE过滤器介绍:

        所有的过滤器都在服务端生效,叫做谓语下推(predicate push down),这样可以保证被过滤掉的数据不会被传送到客户端。

        注意:

        基于字符串的比较器,如RegexStringComparator和SubstringComparator,比基于字节的比较器更慢,更消耗资源。因为每次比较时它们都需要将给定的值转化为String.截取字符串子串和正则式的处理也需要花费额外的时间。
        过滤器本来的目的是为了筛掉无用的信息,所有基于CompareFilter的过滤处理过程是返回匹配的值。

        Interface for row and column filters directly applied within the regionserver. A filter can expect the following call sequence:

        Filter instances are created one per region/scan. This abstract class replaces the old RowFilterInterface. When implementing your own filters, consider inheriting FilterBase to help you reduce boilerplate.

        过滤器实例在每次region/scan时被创建,并且使用抽象类代替了原来的接口。如果你需要实现自定义的过滤器,考虑直接继承FilterBase,来避免许多重复的结构代码。

过滤器执行流程

过滤器属性和它们之间的兼容性

转载于:https://my.oschina.net/cloudcoder/blog/289649

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值