正则表达式的量词

* 贪心、懒惰和占有

量词自身是贪心的。贪心的量词会首先匹配整个字符串。尝试匹配时,他会选定尽可能多的内容,也就是整个
输入。量词首次尝试匹配整个字符串,如果失败则回退一个字符后再次尝试。这个过程叫回溯。他会每次回退一个字符,直到找到匹配的内容或者没有字符可尝试为止。此外,他还记录所有的行为,因此相较另两种方式他对资源的消耗最大。他先吃尽所有的字符,然后每次吐出来一点,慢慢咀嚼消化。

懒惰的量词则使用另一种策略。他从目标的起始位置开始尝试寻找匹配,每次检查字符串的一个字符,寻找他
匹配的内容。最后,他会尝试匹配整个字符串。要是一个量词成为懒惰的,必须在普通量词后添加一个问号
(?)。他每次只吃一点。

占有量词会覆盖整个目标然后尝试寻找匹配内容,但他只尝试一次,不会回溯。占有量词就是在普通量词之后添加一个加号(+)。他不咀嚼而是直接吞咽,然后才想知道吃的是什么。

* 用*、+和?进行匹配

?:零个或一个
+:一个或多个
*:零个或多个

* 匹配特定次数

使用花括号可以限制某个模式在某个范围内匹配的次数,未经修饰的量词就是贪心量词。
范围语法总结:
{n} : 精确匹配n次
{n,} :匹配n次或更多次
{m,n} :匹配m至n次
{0,1} :匹配零次或一次(与?相同)
{1,0} :匹配一次或更多次(与+相同)
{0,} :匹配零次或更多次(与*相同)

* 懒惰量词

?? 懒惰匹配零次或一次
+? 懒惰匹配一次或多次
*? 懒惰匹配零次或多次
{n}? 懒惰匹配n次
{n,}? 懒惰匹配n次或多次
{m,n}? 懒惰匹配m至n次

* 占有量词

?+ 占有式匹配零次或一次
++ 占有式匹配 一次或多次
*+ 占有式匹配零次或多次
{n}+ 占有式匹配n次
{n,}+ 占有式匹配n次或更多次
{m,n}+ 占有式匹配匹配m至n次
占有匹配没有回溯,他一下就选定了所有的输入,不再汇过来查看。

以下对这些关于正则表达式量词说法的正确性进行判断: #### 'a{0,}' 相当于 'a*' 在正则表达式中,`{m,n}` 是一种量词表示形式,其中 `m` 表示最少重复次数,`n` 表示最多重复次数。当 `{0,}` 时,表示前面的元素可以重复 0 次或多次。而 `*` 元字符同样表示前面的元素可以重复 0 次或多次。所以 `'a{0,}'` 相当于 `'a*'`,该说法正确。 #### 'a{1,}' 相当于 'a+' `{1,}` 表示前面的元素最少重复 1 次,最多无限制。`+` 元字符的含义也是前面的元素最少重复 1 次,最多无限制。因此,`'a{1,}'` 相当于 `'a+'`,该说法正确。 #### 'a{0,1}' 相当于 'a?' `{0,1}` 表明前面的元素可以重复 0 次或者 1 次。`?` 元字符的作用是前面紧邻的元素要么出现一次,要么不出现,也就是重复 0 次或 1 次。所以,`'a{0,1}'` 相当于 `'a?'`,该说法正确。 #### {m} 表示前面的字符或子模式重复 m 次 `{m}` 是正则表达式中的量词形式,它的确表示前面的字符或者子模式重复 `m` 次。例如 `a{3}` 表示 `a` 重复 3 次,`(ab){2}` 表示 `ab` 这个子模式重复 2 次。所以该说法正确。 综上所述,以上关于正则表达式量词的说法都是正确的。 ```python import re # 验证 'a{0,}' 相当于 'a*' pattern1 = re.compile(r'a{0,}') pattern2 = re.compile(r'a*') test_str = 'aaaa' print(pattern1.match(test_str) is not None) print(pattern2.match(test_str) is not None) # 验证 'a{1,}' 相当于 'a+' pattern3 = re.compile(r'a{1,}') pattern4 = re.compile(r'a+') print(pattern3.match(test_str) is not None) print(pattern4.match(test_str) is not None) # 验证 'a{0,1}' 相当于 'a?' pattern5 = re.compile(r'a{0,1}') pattern6 = re.compile(r'a?') test_str2 = 'a' print(pattern5.match(test_str2) is not None) print(pattern6.match(test_str2) is not None) # 验证 {m} 表示前面的字符或子模式重复 m 次 pattern7 = re.compile(r'a{3}') test_str3 = 'aaa' print(pattern7.match(test_str3) is not None) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值