JAVA正则表达式-捕获组与非捕获组
Java捕获组与非捕获组的问题困扰了我一阵子,下面是我弄明白后的笔记:
先看例子:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String text = "nexus maven repository index properties updating index central";
String reg = ".*?";
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(text);
while (m.find()) {
System.out.println(m.group());
}
}
}
运行结果:
nexus maven repository index properties updating index central
现在,如果我只想匹配到内的文本内容即“nexus maven repository index properties updating index central”,怎么做呢?这时候就要用到捕获组了。上述代码中“.*?”最中间的“.*?”是匹配内容的正则表达式,只需要将它用括号括起来,就是一个捕获组了。看代码:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String text = "nexus maven repository index properties updating index central";
//下面的正则表达式中共有四个捕获组:()、(.*?)、()和整个匹配到的内容
String reg = "()(.*?)()";
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(text);
while (m.find()) {
System.out.println(m.group(0)); // 整个匹配到的内容
System.out.println(m.group(1)); // ()
System.out.println(m.group(2)); // (.*?)
System.out.println(m.group(3)); // ()
}
}
}
运行结果:
nexus maven repository index properties updating index central
nexus maven repository index properties updating index central
从上述代码得出结论:正则表达式中每个"()"内的部分算作一个捕获组,每个捕获组都有一个编号,从1,2...,编号0代表整个匹配到的内容。
至于非捕获组,只需要将捕获组中"()"变为"(?:)"即可,代码说话:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String text = "nexus maven repository index properties updating index central";
// 下面的正则表达式中共有二个捕获组:(.*?)和整个匹配到的内容,两个非捕获组:(?:)和(?:)
String reg = "(?:)(.*?)(?:)";
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(text);
while (m.find()) {
System.out.println(m.group(0)); // 整个匹配到的内容
System.out.println(m.group(1)); // (.*?)
}
}
}
运行结果:
nexus maven repository index properties updating index central
nexus maven repository index properties updating index central
如果试图运行:System.out.println(m.group(2));将会抛出异常,因为不存在编号为2的捕获组。
5
顶
0
踩
分享到:
2011-09-29 12:28
浏览 16403
评论
5 楼
Kem0574
2018-03-29
luhui1hao 写道
String reg = "()(.*?)()";
这里可以不加?啊。加了有点多此一举,*号已经是代表0个或多个了。
加了?,则只匹配到,不加的话,会一直到的>
4 楼
luhui1hao
2016-10-27
String reg = "()(.*?)()";
这里可以不加?啊。加了有点多此一举,*号已经是代表0个或多个了。
3 楼
cfczdws
2015-11-26
写的清晰明白,不错,非常感谢。
2 楼
JLFree
2014-08-22
其实还有方便的写法 ()(?.*?)() 在正则表达式中加一个变量 data 然后在 group 获取 string str = m.group("data");
1 楼
hepingzhige13
2014-07-03
学习了,非常感谢!赞……