正则表达式
例:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
String str = "abdbkfasfhj2142534asfjlkjlfalk";
Pattern r;
Matcher m;
r = Pattern.compile("([0-9]*)"); //提取连续数字
m = r.matcher(str);
//不完全匹配
if(m.find()) {
System.out.println(m.group(1));
break;
}
//完全匹配
if(Pattern.matches("([a-z]*)([0-9]*)([a-z]*)",str)){
System.out.println("OK!");
}
注意:正则表达式虽然简便好用但是其效率不高,比如匹配一个长度1000多的String类型时,就会导致程序卡死。
规则
1
^
匹配行的开头。
2
$
匹配行的结尾。
3
.
匹配除换行符之外的任何单个字符,使用m选项也可以匹配换行符。
4
[...]
匹配括号中的任何单个字符。
5
[^...]
匹配括号内的任何单个字符。
6
\A
整个字符串的开头。
7
\z
整个字符串的结尾。
8
\Z
除允许的最终行终止符之外的整个字符串的结尾。
9
re*
匹配前面表达式的0次或更多次出现。
10
re+
匹配前面表达式的1次或更多次出现。
11
re?
匹配前面表达式的0或1次出现。
12
re{n}
准确匹配前面表达式的n次出现次数。
13
re{n,}
准确匹配前面表达式的n次以上出现次数。
14
aΙb
匹配a或b。
15
(re)
对正则表达式进行分组并记住匹配的文本。
16
(?: re)
将正则表达式分组而不记住匹配的文本。
17
(?> re)
匹配独立模式而无需回溯。
18
\w
匹配单词字符。
19
\W
匹配非单词字符。
20
\s
匹配空白符,相当于:[\t\n\r\f]
21
\S
匹配非空白。
22
\d
匹配数字,相当于:[0-9]。
23
\D
匹配非数字。
24
\A
匹配字符串的开头。
25
\Z
匹配字符串的结尾。如果存在换行符,则它在换行符之前匹配。
26
\z
匹配字符串的结尾。
27
\G
匹配最后一个匹配结束的点。
28
\n
反向引用以捕获组号:n。
29
\b
在括号外部匹配单词边界,在括号内匹配退格(0x08)。
30
\B
匹配非字边界。
31
\n,\t
匹配换行符,回车符,制表符等。
32
\E
转义(引用)所有字符直到\E。
33
\Q
结束以\Q开头引用。//原文出自【易百教程】,商业转载请联系作者获得授权,非商业请保留原文链接:https://www.yiibai.com/java/java_regular_expressions.html
常用例子
1.匹配一个网站:href="([^"]*)
例如:</script><head><link id="bgLink" rel="preload" href="/th?id=OHR.Rakan_ZH-CN8521004423_1920x1080.jpg&rf=LaDigue_1920x1080.jpg&pid=hp"
这个表达式即可把这串字符中的 href="/th?id=OHR.Rakan_ZH-CN8521004423_1920x1080.jpg&rf=LaDigue_1920x1080.jpg&pid=hp"
这个图片网页提取出来。
2.匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
3.匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
4.匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
5.匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
6.匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
7.匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
8.匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
评注:匹配形式如 0511-4405222 或 021-87888822
9.匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始
10.匹配中国邮政编码:[1-9]\d{5}(?!\d)
评注:中国邮政编码为6位数字