23、正则表达式中的贪婪、回溯与匹配规则详解

最新推荐文章于 2025-12-22 17:01:16 发布

bean

最新推荐文章于 2025-12-22 17:01:16 发布

阅读量78

点赞数

CC 4.0 BY-SA版权

分类专栏：精通正则表达式：文本处理的艺术与科学文章标签：正则表达式贪婪匹配回溯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bean/article/details/149385687

精通正则表达式：文本处理的艺术与科学专栏收录该内容

57 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

正则表达式中的贪婪、回溯与匹配规则详解

1. 原子分组与占有量词的差异

在正则表达式里， !(?> M )+ 和 !(?> M+ ) 存在显著区别。 !(?> M )+ 会丢弃由 !M 创建的未使用状态，不过由于 !M 本身不会创建状态，所以这一操作意义不大。而 !(?> M+ ) 会丢弃由 !M+ 创建的未使用状态，这在实际应用中可能非常有用。

当把复杂的占有量词表达式，如 !(\\";[ˆ"])+ 转换为原子分组时，不能简单地在现有括号中添加 ?> 变成 !(?>\\";[ˆ"])+ 。这种新表达式或许能达成目标，但它与原始的占有量词版本并不等效，就如同把 !M++ 变成 !(?>M)+ 一样。若要实现等效转换，应先移除占有加号，再将剩余部分用原子分组包裹，即 !(?>(\\";[ˆ"])+) 。

2. 环视结构的回溯机制

环视结构（包括前瞻和后顾的肯定与否定形式）与原子分组和占有量词密切相关。它的作用是测试子表达式能否从当前位置开始（前瞻）或结束（后顾）匹配。

在 NFA 环境中，环视结构的子表达式在测试时就像处于一个独立的小世界。它会按需保存状态并在必要时回溯。若子表达式成功匹配，对于肯定环视，整个

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。