学习python正则式这一块时看了好久没看明白. *和. *?的区别,翻看了好多博客也不是很清楚,在自己多次试验后似乎明白了二者的区别。
下面用一个比较简单的例子让有同样疑惑的学习者弄明白:
import re
string='abbcccdefghcccddd'
pattern1='a(.*)ccc'
pattern2='a(.*?)ccc'
match=re.search(pattern1,string)
print(match.group())
match=re.search(pattern2,string)
print(match.group())
输出:
abbcccdefghccc
abbccc
二者区别显而易见,结合翻看的博客来总结一下:
.* 是贪婪模式,倾向于获取最长的满足条件的字符串;
.* ?是非贪婪模式,倾向于获取最短的能满足条件的字符串。
比如在上面的例子中,
.* ?例子在匹配到"abbccc"字符串后就结束匹配,
而.* 例子在匹配到"abbccc"后仍不罢休,继续向后搜索以期待取得更长的匹配字符串。
因此,对于(.* )这种匹配方式会根据模式串(pattern)后面的正则表达式或是字符串(string)本身的结构,可能会有回溯的过程,而(.* ?)这种非贪婪的模式则不会有回溯的过程。
以上是个人在学习探索中总结的经验,不知道是否正确,如有不对还望大神指出以方便其他学习者继续学习!
本文通过实例对比解释了Python正则表达式中.*与.*?的区别,前者为贪婪模式,尽可能匹配更多字符;后者为非贪婪模式,满足条件即停止匹配。深入探讨了两者在匹配过程中的行为差异。
945

被折叠的 条评论
为什么被折叠?



