1.正向先行断言(?=)
正向先行断言用于检查某个模式在当前匹配位置后是否存在,而不包括该模式本身在内。
语法:
X(?=Y)
这个模式将匹配 X,前提是 X 后面必须跟着 Y。但只会返回 X 的匹配结果。
示例:
\d(?= dollars)
在这个例子中,\d 会匹配任何单个数字,但只会在数字后面跟着 " dollars" 的情况下匹配。字符串 5 dollars 可以匹配到 5,而 5 euros 则不会。
2. 反向先行断言(?<=)
反向先行断言用于检查某个模式在当前匹配位置前是否存在,同样不包括该模式本身在内。
语法:
(?<=Y)X
这个模式将匹配 X,前提是 X 前面必须跟着 Y。
示例:
(?<=dollars )\d
在这个例子中,\d 会匹配任何单个数字,但只会在该数字前面跟着 "dollars " 的情况下匹配。字符串 dollars 5 可以匹配到 5,而euros 5则不会。
这里提一下另一种语法:反向零宽断言,用于排除场景
如:(?<!\d)-,只有-短横线前面不是数字的时候,才能匹配出-。
作用:有时候在匹配一段文本中的数字时,如果数字之间由-短横线连接,则后一个数字不能识别为负数,如:25-35岁的人,匹配的结果是应该是25和35,不能是25和-35。
3. 匹配指定集合中任意一个字符 [abc]
[ ] 表示匹配其中任意一个字符。
如:
a[bcd]e:则表示a和e的中间须是b,或c,或d其中的一个
[a-z]:[值1-值2] 则表示值1到值2中间的所有字符都满足(包括值1和值2)。常用该正则来表示大小写字母范围,数字范围。
如:
a[b-d]e:等同于 a[bcd]e,因为 b-d 其实就是b,c,d三个数。
4. 不匹配指定集合中任意一个字符 [abc]
[^ ] 表示不与中括号里的任意字符匹配。
如:
a[^bcd]e:则表示a和e的中间除b,c,d这三个字符外,其他的字符都满足。
5. 后向引用 \num
这里的num指number,也就是数字,当\后面跟数字,表示匹配第几个括号中的结果。
比如:现在有 abcd 字符串,当我们用小括号把 c 包裹起来后,然后在字符串后面写上 \1,即 ab(c)d\1,则这里的 \1 就指 c,因为 \1 表示第1个小括号中的结果。
ab(c)d\1:等同于 abcdc 。
如果我们继续把 ab(c)d\1 中的 d 包括起来,并在后面写上 \2,即 ab(c)(d)\1\2, 那么这里的 \2 就表示 d 这个字符,因为第2个小括号的结果是 d,所以整个表达式就等同于 abcdcd 。
ab(c)(d)\1\2:等同于 abcdcd,也等同于 ab(cd)\1 。
1213

被折叠的 条评论
为什么被折叠?



