正则表达式之零宽断言详解

本文介绍了零宽断言的概念,它用于在某些内容前后查找匹配,执行分正向和反向断言两种情况。详细阐述了正先行、反先行、正后发、反后发四种断言类型,通过实例解析其用法,并给出练习题。最后总结了先行与后发断言区别及记忆方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

  • 什么是零宽断言,为什么要使用零宽断言
  • 怎样使用零宽断言

概念

零宽断言,大多地方这样定义它,用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b ^ $ < > 这样的锚定作用,用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言。我的理解是在一个限定位置的字符串之前或之后进行匹配查找。所以零宽断言,执行过程分两种情况,

  1. 如果是正向断言,应该是这样的:第一步,判断判断断言是否为真(即是否满足一定条件)第二步,如果满足条件,则进行下一步查找匹配。
  2. 如果是反向断言,第一步还是按照正则表达式顺序去匹配。第二步,遇到反向代言,判断是否满足反之代言。

正先行断言

正先行断言,就是在字符串相应位置之前进行查找匹配,使用 (?=exp) 匹配exp前面的位置。

实例

$str="abcgwcab";
$parent='/bc(?=gw)/';
$str=preg_match($parent,$str,$match);
var_dump($match);
/**
输出结果:
int 1
array (size=1) 
    0 => string 'bc' (length=2)
    */

解析:首先查找字符串”abcgwcab”中gw位置,断言为真,然后在匹配bc。如果将正则表达式写成$parent=’/bc(?=gw)ca/’; 将会匹配不成功。

反先行断言

反先行断言,使用 (?!exp) 匹配后面跟的不是exp。

实例:

$str="abcgwcab";
$parent='/bc(?!ww)gw/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
输出:
int 1
array (size=1)
  0 => string 'bcgw' (length=4)
*/

解析:首先判断字符串是否包含bc,然后判断其后面不是ww,最后匹配gw。可以看出反向断言之前后之后,能够在添加其他匹配条件。

正后发断言

正后发断言,就是在字符串相应位置之后进行查找匹配, (?<=exp) 匹配exp后面的位置

实例:

$str="abcgwcab";
$parent='/(?<=gw)ca/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
输出结果:
int 1
array (size=1)
  0 => string 'ca' (length=2)
*/

解析:第一步,查找字符”abcgwcab”中是否包含有gw,返回结果为true,然后进行第二步,查找gw后面是否有ca。

反后发断言

反后发断言,使用(?<!exp),就是首先匹配到相应字符串,再判断当前位置之前不是exp。

$str="abcgwcab";
$parent='/(?<!bc)gw/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
int 0
array (size=0)
  empty
*/

解析:首先在字符串中匹配gw,然后判断其前面是不是bc,发现其前面是bc,故返回false。

练习题

例1:\d+(?=abc) (正先行断言)
判断一个字符串中是否包含’abc’,且其前面是否包含一个或多个数字
例2:(?<=\d\d)\w (正后发断言)
判断字符串中是否存在连续两个数字,且其后面包含一个字母
例3:\d{3} (?!55) (反先行断言)
判断字符串中是否包含连续三个数字,且三个数字后面不是55
例4:(?<!ac)\w\d (反后发断言)
判断一个字符串是否包含一个字母加数字的组合,且其前面不是ac

总结

先行断言与后发断言区别?

  • 先行断言是判断断言之前的正则表达式,断言在其他正则表达式之后。
  • 后发断言是判断断言之前的正则表达式,断言在其他正则表达式之前。
  • 这里的先与后,是其他匹配相对应断言在正则表达式中的顺序。

可以这样记忆

(?exp)先看括号里有没有!

  1. 有!的先判断断言之外的内容;
    再判断断言位置处是否一致
    (意思是,包含<的反断言必定在表达式前面,则判断断言在前面是否存在,不含<的反断言必定在表达式后面,则判断断言在后面是否存在,如果存在,则不匹配断言外的;)
  2. 没有!的先判断断言;
    再判断断言位置外是否一致
    (意思是,包含<的正断言必定在表达式前面,则判断断言外的字符串在后面是否存在,不含<的正断言必定在表达式后面,则判断断言外的字符串在前面是否存在,如果存在,则匹配断言外的;)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值