python正则表达式中有问号要小心

当python正则表达式中有“?”时,直接匹配会得不到正确的结果。比如这个例子:

import re
dd = r'sgsw?ccgsgsw?cwwww'
c = 'w?c'
f = re.findall(c,dd)
print(f)

本来是想找到dd中所有“w?c”的子串,结果发现执行出来的结果不是我们想要的,是下面这个:

[‘c’, ‘c’, ‘c’]

为什么呢?

问题就出在这个“?”上,“?”是元字符,是有特殊含义的。在正则表达式里面意思是匹配0个或多个问号前面的字符,这里就是匹配任意个w加c,上面的dd中没有任意个w加c的字符串,只有w?c的字符串,所以就认为匹配了0个w加c,出来的结果就是3个c。

那怎么才能得到我们想要的结果呢?解决办法就是要把正则表达式中的"?"转换为普通的字符,自然就是使用转义字符“\”。

import re
dd = r'sgsw?ccgsgsw?cwwww'
c = 'w?c'
c=re.sub(r'\?','\?',c)
f = re.findall(c,dd)
print(f)

[‘w?c’, ‘w?c’]

至此,我们得到了想要的结果。

综上,我们在使用正则表达式的时候一定要小心元字符,如果是想把元字符作为一个普通字符使用的话,一定记得前面加上转义字符。

### Python正则表达式问号的用法 在Python正则表达式中,问号`?`是一个元字符,具有特定的含义和用途。它主要用来表示匹配前面的元素零次或一次,即**可选项**。换句话说,问号使得前面的元素变为非必需的[^1]。 例如,模式`colou?r`可以匹配`color`(美国拼写)或`colour`(英国拼写),因为问号允许字母`u`出现零次或一次。 ```python import re pattern = r"colou?r" result = re.match(pattern, "color") print(result.group()) # 输出: color result = re.match(pattern, "colour") print(result.group()) # 输出: colour ``` 此外,问号还用于非贪婪匹配模式。当与星号`*`、加号`+`或花括号`{m,n}`等量词结合时,问号可以让这些量词以非贪婪的方式工作。非贪婪匹配意味着尽可能少地匹配字符,而不是默认的尽可能多地匹配字符[^1]。 以下是一个示例,展示非贪婪匹配的工作方式: ```python pattern = r"<.*?>" text = "<b>bold text</b>" result = re.search(pattern, text) print(result.group()) # 输出: <b> ``` 在这个例子中,`<.*?>`中的问号使星号变为非贪婪模式,因此只匹配从第一个`<`到最近的`>`之间的内容,而不是整个字符串。 最后,问号还可以用于定义正则表达式中的特殊构造,例如非捕获组`(?:...)`或前瞻断言`(?=...)`[^2]。 ```python # 示例:非捕获组 pattern = r"(?:ab)+" result = re.match(pattern, "ababab") print(result.group()) # 输出: ababab # 示例:前瞻断言 pattern = r"Python(?=3)" result = re.match(pattern, "Python3") print(result.group()) # 输出: Python ``` ### 总结 问号Python正则表达式中有三种主要用途: 1. 表示前面的元素为可选项,匹配零次或一次。 2. 与量词结合时,启用非贪婪匹配。 3. 用于定义特殊构造,如非捕获组或前瞻断言。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值