24、正则表达式引擎与实用技巧解析

正则表达式引擎与实用技巧解析

1. NFA与DFA理论与现实差异

“NFA” 的数学和计算意义与通常所说的 “NFA 正则表达式引擎” 不同。理论上,NFA 和 DFA 引擎应匹配相同文本且具备相同特性,但实际中,为追求更丰富、更具表现力的正则表达式,二者语义出现了分歧,例如对反向引用的支持。

DFA 引擎设计上不支持反向引用,而在真正的(数学意义上的)NFA 引擎中添加反向引用支持相对容易。不过,这样做虽创造了更强大的工具,但也使其在数学意义上不再是正则的。不过,目前人们仍沿用 “NFA” 这一名称。

对于用户而言,无需在意其是否正则,只要了解能从引擎中获得什么即可。若想深入学习正则表达式理论,可参考 Aho、Sethi 和 Ullman 所著《Compilers — Principles, Techniques, and Tools》(1986 年 Addison - Wesley 出版,因封面设计常被称为 “红宝书”)的第 3 章。

正则表达式首次被处理时的工作称为编译,DFA 会构建映射,NFA 则构建正则表达式的内部表示,类似一个小型程序供引擎执行。

2. NFA 与 DFA 对比

2.1 预使用编译差异

在将正则表达式用于搜索前,两种引擎都会将其编译为适合各自匹配算法的内部形式。NFA 编译通常更快,所需内存更少,传统 NFA 和 POSIX NFA 的编译差异不大。

2.2 匹配速度差异

在 “正常” 情况下进行简单字面匹配测试时,二者匹配速度相近。DFA 的匹配速度通常与具体正则表达式无关,而 NFA 则直接相关。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值