关于正则表达式中贪婪量词与懒惰量词的形象解释

正则表达式之贪婪与懒惰匹配
本文详细解析了正则表达式中贪婪量词与懒惰量词的工作原理及应用场景,通过实例帮助理解如何选择合适的匹配策略。
 

转自:http://topic.youkuaiyun.com/u/20080620/10/92c46167-00a6-4d94-9664-ff2ca4c20035.html

字符串
a=====b=====b===

a.*b 将匹配满足条件最长的字符串 a=====b=====b

* 因为它比较贪,因此被称为贪婪量词。

贪婪量词的工作方式:
首先将:a=====b=====b=== 全部吃掉,从右边一个一个地吐出来

1. a=====b=====b=== 不匹配,吐出一字符
2. a=====b=====b== 不匹配,再吐出一字符
3. a=====b=====b= 不匹配,再吐出一字符
4. a=====b=====b 匹配了,结束。如果再不匹配继续吐,直到没有字符了,匹配失败

a.*? 将匹配满足条件最短的字符串 a=====b

*? 比较懒,因此称为懒惰或者是勉强量词。

勉强量词的工作方式:
从左边一个一个地吃掉字符
1. a 不能匹配表达式,继续吃
2. a= 不能匹配表达式,继续吃
3. a== 不能匹配表达式,继续吃
4. a=== 不能匹配表达式,继续吃
5. a==== 不能匹配表达式,继续吃
6. a===== 不能匹配表达式,继续吃
7. a=====b 呵呵,终于能匹配表达式了,匹配结束,匹配位置留于字符 b 后面,继续其他的匹配。如果不能匹配则一个一个地吃掉整个字符串直到吃完为止若还没有匹配则匹配失败。

引自:http://topic.youkuaiyun.com/u/20080325/17/fb7a3e8d-029a-4d8e-89ae-77a9d28ec301.html

### C# 中正则表达式的贪婪模式懒惰模式 #### 贪婪模式 在 C# 的正则表达式中,默认情况下所有的量词(`*`, `+`, `?`, `{n,m}`)都处于贪婪模式。这意味着它们会尝试匹配尽可能多的字符[^1]。 例如,在字符串 `"aaaa"` 上应用正则表达式 `a+`,它将返回整个字符串 `"aaaa"`,因为贪婪模式试图找到最长的可能匹配项[^2]。 ```csharp using System; using System.Text.RegularExpressions; class Program { static void Main() { string input = "aaaa"; Regex regex = new Regex(@"a+"); Match match = regex.Match(input); Console.WriteLine(match.Value); // 输出: aaaa } } ``` #### 懒惰模式 为了启用懒惰模式,可以在任何量词之后附加一个问号 (`?`)。这使得正则表达式引擎尽可能少地匹配字符[^3]。 继续以上面的例子为例,如果我们修改正则表达式为 `a+?` 并再次应用于相同的输入字符串 `"aaaa"`,那么这次只会有单个字符 `"a"` 被匹配并返回[^4]。 ```csharp using System; using System.Text.RegularExpressions; class Program { static void Main() { string input = "aaaa"; Regex regex = new Regex(@"a+?"); MatchCollection matches = regex.Matches(input); foreach (Match m in matches) { Console.WriteLine(m.Value); // 输出四次单独的 'a' } } } ``` #### 独占模式 除了贪婪和懒惰两种基本行为外,还存在一种称为 **独占模式** 或者叫占有模式的情况。这种模式不允许回溯操作发生——一旦某个部分被成功匹配就不会再释放给其他后续潜在更优解去重新分配资源了。不过需要注意的是,并不是所有编程语言或者工具支持这一特性;对于那些确实提供相应功能的语言来说通常通过某些特殊语法来实现比如 Java 使用 `(?>...)` 结构表示这样的子组。 然而,在标准 .NET Framework 提供的功能集中并未直接包含所谓“独占”的概念定义方式。因此如果需要类似效果的话,则需依靠精心设计自己的规则组合逻辑达成目的。 --- ### 总结 - 默认状态下,C# 正则表达式中的量词均表现为贪婪形式。 - 若要改变其表现形态至非贪心状态只需简单地于对应符号后追加额外的一个疑问标记即可完成转换过程。 - 关于更加高级别的独享型态目前尚未纳入官方库文件体系之内故无法轻易调用除非借助外部插件辅助处理复杂需求场景下的特殊情况分析工作流程优化建议方案探讨交流平台建设等方面内容不属于本次讲解范围之列敬请谅解!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值