Lucene Automaton(三)

本文通过实例解析DFA(确定有限自动机)的工作原理,展示了如何根据状态转移图判断一个term是否被接受。深入探讨了源码中加速term匹配的技巧,通过生成优化后的状态转移数组实现高效匹配。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在文章Automaton(二)中我们根据图1的例子生成了图2的转移图以及转移图对应在源码中的描述方式,即状态(state)、转移(transition)函数两个数组,如图3所示:

图1:

图2:

图3:

  如果给定一个term,它的最后一个字符作为输入字符,随后在某个状态下,能根据某个转移函数找到下一个状态,并且该状态为可接受状态,那么term是被DFA接受的,其中输入字符、状态、转移函数、DFA的概念见文章Automaton的介绍。

  根据图3的两个数据结构,用肉眼已经可以判断出一个term能否被DFA接受,但是源码中基于这两个数组还会进一步处理,使得能更快速的判断term是否被DFS接受,处理的结果为生成一个新的transitions[ ]数组,使得根据状态输入字符两个条件能在该数组中找到下一个状态。由于源码中该数组与图3中的数组名重名了,为了便于描述,下文将称呼这个新的transitions[ ]数组为newTransitions[ ]数组。

 

看这里:https://www.amazingkoala.com.cn/Lucene/gongjulei/2020/0821/163.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值