正则表达式-- (?:pattern)与(?=pattern)的区别
2018年04月20日 13:48:44 shashagcsdn 阅读数:115 标签: 正则表达式 非获取匹配 更多
个人分类: 学习笔记
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/shashagcsdn/article/details/80017678
学习正则表达式时,对(?:pattern)与(?=pattern)的区别做个记录。
官方定义
(pattern) : 匹配 pattern 并获取这一匹配,所获取的匹配可以从产生的 Matches 集合得到。
(?:pattern) :匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(?=pattern) :正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
共同点
(?:pattern)
与 (?=pattern)
都匹配pattern,但不会把pattern结果放到Matches的集合中。
区别
(?:pattern)
匹配得到的结果包含pattern,(?=pattern)
则不包含。如:
对字符串:"industry abc"的匹配结果:
industr(?:y|ies) ---> "industry"
industr(?=y|ies) ---> "industr"
- 1
- 2
- 3
- 是否消耗字符
(?:pattern)
消耗字符,下一字符匹配会从已匹配后的位置开始。(?=pattern)
不消耗字符,下一字符匹配会从预查之前的位置开始。
即后者只预查,不移动匹配指针。如:
注:示例中的位置为易于理解的视图位置,具体传动原理可以参照这篇文章 正则基础之——NFA引擎匹配原理 (感谢这个作者的分析)。