python 正则表达式之零宽断言

零宽断言详解

最新推荐文章于 2025-09-07 01:02:55 发布

转载最新推荐文章于 2025-09-07 01:02:55 发布 · 85 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/nat-zhu/p/8040397.html

文章标签：

#python

本文详细介绍了正则表达式中的零宽断言概念及其使用方法，包括正向肯定、正向否定、反向肯定和反向否定四种类型，并通过Python示例展示了如何应用这些断言进行精确匹配。

零宽断言：用于查找特定内容之前或之后的内容，但并不包括特定内容本身。
对于零宽断言来说，我认为最重要的一个概念是位置，零宽断言用于指定一个位置，这个位置应该满足一定的条件(它附近满足什么表达式)，并且这个位置不是字符（因此匹配返回无结果），仅仅是一个位置，因此它们也被称为零宽断言
零宽断言重点的这一个位置，是通过一个条件：这个位置附近（前或者后）存在或者不存在一个A（A可以是一个表达式）来决定的

请忘记它的各种名字，我们只记忆公式本身：

(?=exp) ：此位置后面匹配表达式exp
(?<=exp)：此位置前面匹配表达式exp
(?!exp)：此位置后面不匹配表达式exp
(?<!exp)：此位置前面不匹配表达式exp
注：有些地方只支持部分零宽断言，比如在线正则表达式

下面是示例：
>>> import re
>>> str = '<div>hello world</div>'
>>> re.search('(?=he).*',str)
<_sre.SRE_Match object; span=(5, 22), match='hello world</div>'>
>>> re.search('(?=he).*(?<=ld)',str)
<_sre.SRE_Match object; span=(5, 16), match='hello world'>
>>> re.search('(?<=<div>).*(?=</div>)',str)
<_sre.SRE_Match object; span=(5, 16), match='hello world'>

>>> str = '3446456sdff456a'
>>> re.search('[a-z]{3}(?!/d)',str)
<_sre.SRE_Match object; span=(7, 10), match='sdf'>
>>> re.search('[a-z]{3}(?![a-z])',str)
<_sre.SRE_Match object; span=(8, 11), match='dff'>

>>> re.search('(?<![0-9])[0-9]{3}',str)
<_sre.SRE_Match object; span=(0, 3), match='344'>　　 #匹配到了第一个位置
>>> re.search('(?<![0-9])[0-9]{3}(?![0-9])',str)
<_sre.SRE_Match object; span=(11, 14), match='456'>

转载于:https://www.cnblogs.com/nat-zhu/p/8040397.html