正则表达式简介:
正则表达式(Regular Expression)是用于描述一组字符串特征的模式,用来匹配特定的字符串。通过特殊字符+普通字符来进行模式描述,从而达到文本匹配目的工具。
正则表达式目前被集成到了各种文本编辑器/文本处理工具当中。
在生活工作中,它被应用于诸多场景,譬如表单提交时,进行用户名密码的验证;从大量信息中快速提取指定内容,在一批url中,查找指定url;将指定格式的文本进行正则匹配查找,找到之后进行特定替换等。
单个符号简介:
1.x 用来表达指定字符x 如:Java匹配Java
2. . 表达任意单个字符(除换行外) 如:Java匹配J..a
3.[] 只有括号内的才参与匹配,只匹配单个字符 如:tan匹配t[abcd]n
4.匹配次数的符号 *(0次或多次)、+(1次或多次)、?(0次或1次)、{n}(恰好n次)、{n,m}(n次到m次之间)
5. ^ 表示否 、如果在方括号内 表示不想匹配的字符 如y匹配[^x]
6.\s 表示非空 \r表示空
快捷符号简介:
1、\d表示[0—9]
2、\D表示[^0—9]
3、\w表示[0—9A—Z_a—z]
4、\W表示[^0—9A—Z_a—z]
5、\s表示[\t\n\r\f]
6、\S表示[^\t\n\r\f]
当然,正则表达式也还有许多好用的方法:
如查找类的matches方法(匹配符合一个模式的字符串集)
如“Java is fun”.matches("Java.☆") “Java is cool”.matches("Java.☆")均返回true
还有诸如替换类的repalceAll方法 用于替换所有匹配的子字符串
如:System.out.println("Java Java Java").repalceAll("v\\w","wi"));
显示 Jawi Jawi Jawi
又或者repalceFirst方法替换第一个匹配的子字符串
如System.out.println("Java Java Java").repalceFirst("v\\w","wi"));
显示 Jawi Java Java
抑或是拆分类的split 使用匹配的分隔符将一个字符串拆分为子字符串
如:String[] tokens = "Java1HTML2Perl".split("\\d")
就用数字作为分隔符将字符串分割成Java HTML Perl 并分别存入token[0] token[1] token [2]中