以我的理解是,正则表达式其实就是字符串的格式,用于检验有一定格式的字符串。在我们检查字符串是否匹配一定的格式的时候,就会用上正则表达式。例如检验邮箱地址是否合法,IP号是否合法等等。
以下是一些正则表达式:
注意:在java中用\\表示单\
是否包含中文的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\\x00-\\xff]
匹配空行的正则表达式:\\n[\\s| ]*\\r
匹配HTML标记的正则表达式:/<(.*)>.*<\\/\1>|<(.*) \\/>/
匹配首尾空格的正则表达式:(^\\s*)|(\\s*$)
匹配Email地址的正则表达式:\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*
匹配网址URL的正则表达式:"[a-zA-z]+://[^\\s]*
匹配日期的正则表达式:例如2011-05-24或2011-05-24 10:09:21 : ^[0-9]{4}-(((0[13578]|(10|12))-(0[1-9]|[1-2][0-9]|3[0-1]))|(02-(0[1-9]|[1-2][0-9]))|((0[469]|11)-(0[1-9]|[1-2][0-9]|30)))($|\\s([0-1]\\d|[2][0-3])\\:[0-5]\\d\\:[0-5]\\d)
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:\\d{3}-\\d{8}|\\d{4}-\\d{7}
匹配腾讯QQ号:[1-9][0-9]{4,}
匹配中国邮政编码:[1-9]\d{5}(?!\d)
匹配身份证:\\d{15}|\\d{18}
匹配ip地址:\\d+\\.\\d+\\.\\d+\\.\\d+
匹配特定数字:
^[1-9]\\d*$ //匹配正整数
^-[1-9]\\d*$ //匹配负整数
^-?[1-9]\\d*$ //匹配整数
^[1-9]\\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*$ //匹配正浮点数
^-([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*)$ //匹配负浮点数
^-?([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*|0?\\.0+|0)$ //匹配浮点数
^[1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*|0?\\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*))|0?\\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
宜家是一个例子,利用正则表达式检验邮箱是否合法!
public class Test
{
public static void main(String[] args)
{
String regex="\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*";//一个正则表达式的字符串
String str="bonelwh@163.com";//建立一个邮箱地址的字符串用于检验
if(str.matches(regex))//判断字符串变量是否与正则表达式匹配
{
System.out.println("邮箱地址格式合法!");
}
}
}