正则表达式处理机制详解
规则1:最早开始的匹配获胜
在字符串匹配中,有一条重要规则:任何在字符串中更早(最左侧)开始的匹配总是优先于任何稍后开始的合理匹配。这条规则并不关心获胜匹配的长度,只是在字符串所有可能的匹配中,选择最左侧开始的那个。
匹配过程是这样的:首先从要搜索的字符串的最开始(第一个字符之前)尝试匹配。“尝试”意味着从该位置开始测试整个(可能很复杂的)正则表达式的每一种排列。如果所有可能性都尝试完仍未找到匹配,就从第二个字符之前重新开始完整地尝试整个表达式。这个完整的重试过程会在字符串的每个位置进行,直到找到匹配。只有当在字符串的每个位置都进行了完整重试,一直到字符串末尾(最后一个字符之后)都没有找到匹配时,才会报告“无匹配”结果。
例如,当尝试用 !ORA" 匹配 FLORAL 时,从字符串开头的第一次尝试失败(因为 !ORA" 无法匹配 FLO ),从第二个字符开始的尝试也失败(它也无法匹配 LOR ),但从第三个位置开始的尝试成功匹配,所以引擎停止并报告匹配结果: FLORAL 。
再比如,用 !cat" 匹配 The dragging belly indicates your cat is too fat 时,匹配结果在 indicates 中,而不是在该行稍后出现的 cat 这个单词上。虽然 cat 这个单词可以匹
超级会员免费看
订阅专栏 解锁全文
332

被折叠的 条评论
为什么被折叠?



