24、正则表达式引擎与实用技巧解析

最新推荐文章于 2025-12-14 21:39:32 发布

bean

最新推荐文章于 2025-12-14 21:39:32 发布

阅读量73

点赞数

CC 4.0 BY-SA版权

分类专栏：精通正则表达式：文本处理的艺术与科学文章标签：正则表达式 NFA DFA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bean/article/details/149385691

精通正则表达式：文本处理的艺术与科学专栏收录该内容

57 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

正则表达式引擎与实用技巧解析

1. NFA与DFA理论与现实差异

“NFA” 的数学和计算意义与通常所说的 “NFA 正则表达式引擎” 不同。理论上，NFA 和 DFA 引擎应匹配相同文本且具备相同特性，但实际中，为追求更丰富、更具表现力的正则表达式，二者语义出现了分歧，例如对反向引用的支持。

DFA 引擎设计上不支持反向引用，而在真正的（数学意义上的）NFA 引擎中添加反向引用支持相对容易。不过，这样做虽创造了更强大的工具，但也使其在数学意义上不再是正则的。不过，目前人们仍沿用 “NFA” 这一名称。

对于用户而言，无需在意其是否正则，只要了解能从引擎中获得什么即可。若想深入学习正则表达式理论，可参考 Aho、Sethi 和 Ullman 所著《Compilers — Principles, Techniques, and Tools》（1986 年 Addison - Wesley 出版，因封面设计常被称为 “红宝书”）的第 3 章。

正则表达式首次被处理时的工作称为编译，DFA 会构建映射，NFA 则构建正则表达式的内部表示，类似一个小型程序供引擎执行。

2. NFA 与 DFA 对比

2.1 预使用编译差异

在将正则表达式用于搜索前，两种引擎都会将其编译为适合各自匹配算法的内部形式。NFA 编译通常更快，所需内存更少，传统 NFA 和 POSIX NFA 的编译差异不大。

2.2 匹配速度差异

在 “正常” 情况下进行简单字面匹配测试时，二者匹配速度相近。DFA 的匹配速度通常与具体正则表达式无关，而 NFA 则直接相关。

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。