python贪婪匹配顺序_Python正则表达式：贪婪模式返回多个空匹配

最新推荐文章于 2025-08-15 22:44:18 发布

原创最新推荐文章于 2025-08-15 22:44:18 发布 · 273 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python贪婪匹配顺序

这种模式仅意味着将字符串中的所有内容抓取到数据中第一个潜在句子边界为止：

[^\.?!\r\n]*

输出：

>>> pattern = re.compile(r"([^\.?!\r\n]*)")

>>> matches = pattern.findall("Australians go hard!!!") # Actual source snippet, not a personal comment about Australians. :-)

>>> print matches

['Australians go hard', '', '', '', '']

从Python文档中：

re.findall(模式，字符串，标志= 0)

返回字符串中模式的所有非重叠匹配项，作为字符串列表。从左到右扫描字符串，并以找到的顺序返回匹配项。如果模式中存在一个或多个组，则返回一个组列表；否则，返回一个列表。如果模式包含多个组，则这将是一个元组列表。空匹配项将包括在结果中，除非它们碰到另一个匹配项的开头。

现在，如果从左到右扫描字符串，并且运算符是贪婪的，那么很有意义的是，返回的第一个匹配项是整个字符串，直到感叹号为止。但是，在消耗完该部分之后，我看不到该模式如何准确地产生四次空匹配，大概是通过在“

d”之后向左扫描字符串来实现的。我确实知道运算符意味着该模式可以匹配空字符串，但我只是看不出它在字母的后缀“

d”和前导“！”之间会多次执行该操作。标点符号。

添加^锚具有以下效果：

>>> pattern = re.compile(r"^([^\.?!\r\n]*)")

>>> matches = pattern.findall("Australians go hard!!!")

>>> print matches

['Australians go hard']

由于这消除了空字符串匹配，因此似乎表明所述空匹配发生在字符串的前导“ A”之前。但这似乎与按照找到的顺序返回的匹配项的文档相矛盾(应该先出现前导“

A”之前的匹配项)，而且，恰好有四个空匹配项使我感到困惑。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。