什么是正则表达式?
正则表达式(Regular Expression,简称 regex)是一种用于匹配字符串的强大工具。它可以用于检查字符串是否符合某种格式、提取符合特定条件的子串、进行字符串替换等。正则表达式被广泛应用于文本处理、数据验证、日志分析等场景。
在 Java 中,String
类的 matches()
方法可以用来判断字符串是否符合某个正则表达式。例如,我们想要判断一个字符串是否符合邮箱格式,可以使用如下代码:
public class RegexExample {
public static void main(String[] args) {
String email = "aaaa731341@163.com";
boolean isValid = email.matches("[a-zA-Z0-9]+@[a-zA-Z0-9]+\\.com");
System.out.println("邮箱格式是否正确: " + isValid);
}
}
上述代码使用了 matches()
方法,传入了邮箱的匹配规则:
[a-zA-Z0-9]+
:匹配由字母和数字组成的用户名。@
:必须包含@
符号。[a-zA-Z0-9]+
:匹配域名部分。\.com
:确保邮箱以.com
结尾。
Java 正则表达式示例
基本匹配示例
public class RegexDemo {
public static void main(String[] args) {
String str = "oooo";
System.out.println(str.matches("o+")); // true
}
}
在这个例子中:
o+
表示匹配一个或多个o
,因此oooo
符合该规则。matches()
方法返回true
。
常用限定符(量词)
符号 | 描述 |
---|---|
* | 匹配前面的子表达式零次或多次。例如,zo* 可以匹配 "z"、"zo"、"zoo"。等价于 {0,} 。 |
+ | 匹配前面的子表达式一次或多次。例如,zo+ 可以匹配 "zo" 和 "zoo",但不能匹配 "z"。等价于 {1,} 。 |
? | 匹配前面的子表达式零次或一次。例如,do(es)? 可以匹配 "do" 和 "does"。等价于 {0,1} 。 |
{n} | 匹配确定的 n 次。例如,o{2} 只能匹配 "food" 中的 "oo"。 |
{n,} | 至少匹配 n 次。例如,o{2,} 匹配 "foooood" 中的所有 o 。 |
{n,m} | 匹配 n 到 m 次。例如,o{1,3} 匹配 "fooooood" 中的前三个 o 。 |
字符类匹配
如果我们想要匹配特定范围的字符,可以使用 []
符号。例如:
public class RegexCharSet {
public static void main(String[] args) {
String str = "abcabccaa";
System.out.println(str.matches("[abc]*")); // true
}
}
语法 | 作用 |
---|---|
[abc] | 匹配 a 、b 或 c 中的任意一个字符。 |
[^abc] | 匹配除 a 、b 、c 以外的任何字符。 |
[a-z] | 匹配 a 到 z 之间的任意小写字母。 |
[A-Z] | 匹配 A 到 Z 之间的任意大写字母。 |
. | 匹配除换行符 \n 和 \r 之外的任何单个字符。 |
\w | 匹配字母、数字、下划线 [A-Za-z0-9_] 。 |
\s | 匹配所有空白符(空格、制表符、换行符等)。 |
\d | 匹配任何数字 [0-9] 。 |
\D | 匹配非数字字符。 |
\S | 匹配非空白字符。 |
高级匹配技巧
1. 匹配手机号
public class PhoneRegex {
public static void main(String[] args) {
String phone = "13812345678";
System.out.println(phone.matches("1[3-9]\\d{9}")); // true
}
}
1[3-9]
:匹配以1
开头,第二位是3-9
之间的数字。\d{9}
:匹配接下来的 9 位数字。
2. 提取字符串中的数字
import java.util.regex.*;
public class ExtractNumbers {
public static void main(String[] args) {
String text = "订单号:12345,总金额:678元";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
System.out.println("找到数字: " + matcher.group());
}
}
}
3. 替换字符串中的特定内容
public class ReplaceDemo {
public static void main(String[] args) {
String text = "Java is awesome!";
String newText = text.replaceAll("Java", "Python");
System.out.println(newText); // 输出: Python is awesome!
}
}
结语
正则表达式是一个功能强大的工具,可以帮助我们高效地处理字符串匹配、提取、替换等任务。掌握正则表达式不仅能提升开发效率,还能在数据处理、爬虫、文本分析等领域发挥重要作用。希望本教程能帮助你快速上手 Java 中的正则表达式!
如果你想进一步学习正则表达式,可以参考 菜鸟教程 了解更详细的语法规则和应用示例。