java 正则表达式

最新推荐文章于 2025-03-31 18:19:30 发布

陈葛杰

最新推荐文章于 2025-03-31 18:19:30 发布

阅读量236

点赞数

分类专栏： JAVA基础文章标签： java 正则表达式

本文链接：https://blog.youkuaiyun.com/weixin_42803127/article/details/103420125

版权

JAVA基础专栏收录该内容

11 篇文章

订阅专栏

正则表达式

例：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

String str = "abdbkfasfhj2142534asfjlkjlfalk";

Pattern r;
Matcher m;
r = Pattern.compile("([0-9]*)");	//提取连续数字
m = r.matcher(str);
//不完全匹配
if(m.find()) {
	System.out.println(m.group(1));
	break;
}
//完全匹配
if(Pattern.matches("([a-z]*)([0-9]*)([a-z]*)",str)){
	System.out.println("OK!");
}

注意：正则表达式虽然简便好用但是其效率不高，比如匹配一个长度1000多的String类型时，就会导致程序卡死。

规则

1
^
匹配行的开头。


2
$
匹配行的结尾。


3
.
匹配除换行符之外的任何单个字符，使用m选项也可以匹配换行符。


4
[...]
匹配括号中的任何单个字符。


5
[^...]
匹配括号内的任何单个字符。


6
\A
整个字符串的开头。


7
\z
整个字符串的结尾。


8
\Z
除允许的最终行终止符之外的整个字符串的结尾。


9
re*
匹配前面表达式的0次或更多次出现。


10
re+
匹配前面表达式的1次或更多次出现。


11
re?
匹配前面表达式的0或1次出现。


12
re{n}
准确匹配前面表达式的n次出现次数。


13
re{n,}
准确匹配前面表达式的n次以上出现次数。


14
aΙb
匹配a或b。


15
(re)
对正则表达式进行分组并记住匹配的文本。


16
(?: re)
将正则表达式分组而不记住匹配的文本。


17
(?> re)
匹配独立模式而无需回溯。


18
\w
匹配单词字符。


19
\W
匹配非单词字符。


20
\s
匹配空白符，相当于：[\t\n\r\f]


21
\S
匹配非空白。


22
\d
匹配数字，相当于：[0-9]。


23
\D
匹配非数字。


24
\A
匹配字符串的开头。


25
\Z
匹配字符串的结尾。如果存在换行符，则它在换行符之前匹配。


26
\z
匹配字符串的结尾。


27
\G
匹配最后一个匹配结束的点。


28
\n
反向引用以捕获组号：n。


29
\b
在括号外部匹配单词边界，在括号内匹配退格(0x08)。


30
\B
匹配非字边界。


31
\n,\t
匹配换行符，回车符，制表符等。


32
\E
转义(引用)所有字符直到\E。


33
\Q
结束以\Q开头引用。//原文出自【易百教程】，商业转载请联系作者获得授权，非商业请保留原文链接：https://www.yiibai.com/java/java_regular_expressions.html

常用例子

 	1.匹配一个网站：href="([^"]*)
	例如：</script><head><link id="bgLink" rel="preload" href="/th?id=OHR.Rakan_ZH-CN8521004423_1920x1080.jpg&amp;rf=LaDigue_1920x1080.jpg&amp;pid=hp"
	这个表达式即可把这串字符中的	href="/th?id=OHR.Rakan_ZH-CN8521004423_1920x1080.jpg&amp;rf=LaDigue_1920x1080.jpg&amp;pid=hp"
	这个图片网页提取出来。
	
	2.匹配中文字符的正则表达式： [\u4e00-\u9fa5]
　　评注：匹配中文还真是个头疼的事，有了这个表达式就好办了

　　3.匹配双字节字符(包括汉字在内)：[^\x00-\xff]
　　评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

　　4.匹配空白行的正则表达式：\n\s*\r
　　评注：可以用来删除空白行

　　5.匹配首尾空白字符的正则表达式：^\s*|\s*$
　　评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

　　6.匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
　　评注：表单验证时很实用

　　7.匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
　　评注：表单验证时很实用

　　8.匹配国内电话号码：\d{3}-\d{8}|\d{4}-\d{7}
　　评注：匹配形式如 0511-4405222 或 021-87888822

　　9.匹配腾讯QQ号：[1-9][0-9]{4,}
　　评注：腾讯QQ号从10000开始

　　10.匹配中国邮政编码：[1-9]\d{5}(?!\d)
　　评注：中国邮政编码为6位数字