filter所谓的特性

过滤链

其实在07-02这个例子里,我们使用了两个过滤器,EncodingFilter负责设置编码,SecurityFilter负责控制权限,那这两个过滤器是怎么起作用的呢?它们两个同时过滤一个请求时谁先谁后呢?

下面这个图会告诉我们答案。

所有的奥秘就在Filter中的FilterChain中。服务器会按照web.xml中过滤器定义的先后循序组装成一条链,然后一次执行其中的doFilter()方法。执行的顺序就如上图所示,执行第一个过滤器的chain.doFilter()之前的代码,第二个过滤器的chain.doFilter()之前的代码,请求的资源,第二个过滤器的chain.doFilter()之后的代码,第一个过滤器的chain.doFilter()之后的代码,最后返回响应。

因此在07-02中执行的代码顺序是:

  1. 执行EncodingFilter.doFilter()中chain.doFilter()之前的部分:request.setCharacterEncoding("gb2312");

  2. 执行SecurityFilter.doFilter()中chain.doFilter()之前的部分:判断用户是否已登录。

    如果用户已登录,则访问请求的资源:/admin/index.jsp。

    如果用户未登录,则页面重定向到:/failure.jsp。

  3. 执行SecurityFilter.doFilter()中chain.doFilter()之后的部分:这里没有代码。

  4. 执行EncodingFilter.doFilter()中chain.doFilter()之后的部分:这里也没有代码。

过滤链的好处是,执行过程中任何时候都可以打断,只要不执行chain.doFilter()就不会再执行后面的过滤器和请求的内容。而在实际使用时,就要特别注意过滤链的执行顺序问题,像EncodingFilter就一定要放在所有Filter之前,这样才能确保在使用请求中的数据前设置正确的编码。

7.4. filter的详细配置

我们已经了解了filter的基本用法,还有一些细节配置在特殊情况下起作用。

在servlet-2.3中,Filter会过滤一切请求,包括服务器内部使用forward转发请求和<%@ include file="/index.jsp"%>的情况。

到了servlet-2.4中Filter默认下只拦截外部提交的请求,forward和include这些内部转发都不会被过滤,但是有时候我们需要forward的时候也用到Filter,这样就需要如下配置。

<filter>
    <filter-name>TestFilter</filtername>
    <filter-class>anni.TestFilter</filter-class>
</filter>
<filter-mapping>
    <filter-name>TestFilter</filtername>
    <url-pattern>/*</url-pattern>
    <dispatcher>REQUEST</dispatcher>
    <dispatcher>FORWARD</dispatcher>
    <dispatcher>INCLUDE</dispatcher>
    <dispatcher>EXCEPTION</dispatcher>
</filter-mapping>
        

这样TestFilter就会过滤所有状态下的请求。如果我们没有进行设置,默认使用的就是REQUEST。而EXCEPTION是在isErrorPage="true"的情况下出现的,这个用处不多,看一下即可。

这里FORWARD是解决request.getDispatcher("index.jsp").forward(request, response);无法触发Filter的关键,配置上这个以后再进行forward的时候就可以触发过滤器了。

Filter还有一个有趣的用法,在filter-mapping中我们可以直接指定servlet-mapping,让过滤器只处理一个定义在web.xml中的servlet。

<filter-mapping>
    <filter-name>TestFilter</filter-name>
    <servlet-name>TestServlet</servlet-name>
</filter-mapping>

<servlet>
    <servlet-name>TestServlet</servlet-name>
    <servlet-class>anni.TestServlet</servlet-class>
</servlet>
<servlet-mapping>
    <servlet-name>TestServlet</servlet-name>
    <url-pattern>/TestServlet</url-pattern>
</servlet-mapping>
        

直接指定servlet-name,TestFilter便会引用TestServlet配置的url-pattern,在某些filter与servlet绑定的情况下不失为一个好办法。

### Bloom Filter 数据结构概述 布隆过滤器是一种用于快速、节省内存地判断元素是否属于某个集合的数据结构[^5]。其核心在于使用位数组和多个哈希函数来表示集合成员关系,具有极高的查询效率和较低的存储开销。 #### 原理说明 布隆过滤器通过一系列独立随机分布的哈希函数将待加入集合的对象映射到位向量的不同位置上;当检查某对象是否存在于给定集合内时,只需验证这些对应索引处是否有标记即可完成判定过程。值得注意的是,由于可能存在不同输入经过相同哈希运算后指向同一地址的情况(即碰撞),因此即使所有测试均返回肯定结果也不能完全排除误判的可能性——这就是所谓的“假阳现象”。不过只要合理配置参数并选用足够多且均匀散列性质良好的哈希算法,则能够有效控制此类错误发生的几率至可接受范围内[^1]。 ```python import mmh3 from bitarray import bitarray class SimpleBloomFilter(object): def __init__(self, size=1000000, hash_num=7): self.size = size self.hash_num = hash_num self.bit_array = bitarray(size) self.bit_array.setall(0) def add(self, string): for seed in range(self.hash_num): result = mmh3.hash(string, seed) % self.size self.bit_array[result] = 1 def lookup(self, string): for seed in range(self.hash_num): result = mmh3.hash(string, seed) % self.size if not self.bit_array[result]: return "Nope" return "Probably yes" bloom_filter_example = SimpleBloomFilter() print(bloom_filter_example.lookup("hello")) bloom_filter_example.add("hello") print(bloom_filter_example.lookup("hello")) ``` 上述代码展示了如何创建一个简单的布隆过滤器类 `SimpleBloomFilter` 并对其进行基本操作。这里采用了 MurmurHash3 这种非加密级但性能优异的通用型哈希函数作为内部组件之一,并借助 Python 的第三方库 `bitarray` 来管理底层二进制序列[^2]。 #### 应用场景分析 鉴于布隆过滤器具备高效的存取特性及其特有的容错机制,在实际工程中有广泛的应用价值: - **缓存穿透防护**:防止恶意请求绕过本地缓存直接访问数据库造成压力过大; - **爬虫去重处理**:避免重复抓取已收录网页资源浪费带宽; - **黑名单/白名单匹配**:加速身份认证流程减少不必要的磁盘I/O次数; - **分布式系统一致性校验**:辅助节点间同步状态信息提高整体可靠性等[^4]。 然而需要注意的是,传统意义上的布隆过滤器并不支持元素移除功能,因为这可能会导致原本存在的条目被误删从而引发更多问题。针对这一局限性,研究者们提出了诸如计数式布隆过滤器(CBF) 或者 cuckoo filters 等改进版本以适应更复杂的需求环境[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值