1、正则表达式取反
(?!exp) 匹配后面跟的不是exp的位置,例如:
对于字符串:acbca,正则表达式:regex:(?!a)
匹配结果:a|b|ca|c (红色竖线位置)(匹配后边不是a的位置)
regex:(?!a)\wc 匹配结果:abcac(只匹配b后的c不匹配a后的c)
对于文本:
abc
abcd
abd
若想选择不是以abc开始的行。regex:^(?!abc).*$
(?!CRH1)(CRH[0-9]{1}[AF]{0,1}|380[ABCD][L]{0,1})===表示后面跟的不是以CRH1且满足(CRH[0-9]{1}[AF]{0,1}|380[ABCD][L]{0,1})的所有字符串。
(pattern) : 匹配 pattern 并获取这一匹配,所获取的匹配可以从产生的 Matches 集合得到。
(?:pattern) :匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(?=pattern) :正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
共同点
(?:pattern)
与 (?=pattern)
都匹配pattern,但不会把pattern结果放到Matches的集合中,即Matcher.group()不会匹配到(?;pattern)与(?=pattern)
区别
(?:pattern)
匹配得到的结果包含pattern,(?=pattern)
则不包含。如:对字符串:"industry abc"的匹配结果: industr(?:y|ies) ---> "industry" industr(?=y|ies) ---> "industr"
是否消耗字符
(?:pattern)
消耗字符,下一字符匹配会从已匹配后的位置开始。(?=pattern)
不消耗字符,下一字符匹配会从预查之前的位置开始。
即后者只预查,不移动匹配指针。如:
即“Windows (?:98|2000|XP)ABC”类似但不等同于“Windows (?=98|2000|XP)(98|2000|XP)ABC”(因为后者可以获取匹配)。
3、推荐网址
常用正则表达式、正则表达式查询和学习
http://www.jb51.net/tools/regex.htm
如何看懂复杂的正则表达式
http://www.crifan.com/tutorial_teach_you_how_to_understand_the_complex_regular_expression/comment-page-1/
正则表达式基本语法
http://www.cnblogs.com/light169/archive/2006/10/18/532347.html