正则表达式之贪婪模式

最新推荐文章于 2023-10-22 16:32:30 发布

最新推荐文章于 2023-10-22 16:32:30 发布 · 176 阅读

文章标签：

象 * 这样地重复是“贪婪的”；当重复一个 RE 时，匹配引擎会试着重复尽可能多的次数。如果模式的后面部分没有被匹配，匹配引擎将退回并再次尝试更小的重复。

一步步的示例可以使它更加清晰。让我们考虑表达式 a[bcd]*b。它匹配字母 "a"，零个或更多个来自类 [bcd]中的字母，最后以 "b" 结尾。现在想一想该 RE 对字符串 "abcbd" 的匹配。
Step Matched Explanation
1 a a 匹配模式
2 abcbd 引擎匹配 [bcd]*，并尽其所能匹配到字符串的结尾
3 Failure 引擎尝试匹配 b，但当前位置已经是字符的最后了，所以失败
4 abcb 退回，[bcd]*尝试少匹配一个字符。
5 Failure 再次尝次b，但在当前最后一位字符是"d"。
6 abc 再次退回，[bcd]*只匹配 "bc"。
7 abcb 再次尝试 b ，这次当前位上的字符正好是 "b"

RE 的结尾部分现在可以到达了，它匹配 "abcb"。这证明了匹配引擎一开始会尽其所能进行匹配，如果没有匹配然后就逐步退回并反复尝试 RE 剩下来的部分。直到它退回尝试匹配 [bcd] 到零次为止，如果随后还是失败，那么引擎就会认为该字符串根本无法匹配 RE 。