正则表达式在线测试:http://tool.chinaz.com/regex/
指定字符匹配:
[xyz] | 匹配指定字符中的任意一个字符 | 添加^表示排除指定字符 |
[a-z] | 匹配指定范围中的任意一个字符 | |
x|y | 匹配指定字符x或y中的任意一个 | |
[\u4e00-\u9fa5] | 匹配任意汉字 |
任意字符匹配:
. | 匹配任意一个字符,除“\r\n” | |
\w | 匹配任意一个字母或数字,包括下划线 | |
\d | 匹配任意一个数字字符 | |
\s | 匹配任何一个空白字符,包括空格、制表符、换页符等等 | \n:换行符 \r:回车符 \t:制表符 \f:换页符 \v:垂直制表符 |
大写取反
指定匹配次数
* | 零次或多次 | |
+ | 一次或多次 | |
? | 零次或一次 | |
{n} | n次 | |
{n,} | 最少n次 | |
{n,m} | 最少n次,最多m次 |
匹配位置:
\b | 匹配任何单词的边界 | |
^ | 匹配字符串的开始位置 | |
$ | 匹配字符串的结束位置 |
断言:断言用来声明匹配字串的头或尾部特征。但断言中的正则表达式,只是用来声明某种特征,不会进入匹配字串。
(?=exp) | 尾部断言 | 如\b\w+(?=ing\b),查找I'm singing while you're dancing.时,它会匹配sing和danc |
(?!exp) | 尾部否断言 | 如\d{3}(?!\d)匹配三位数字,而且这三位数字的后面不能是数字 |
(?<=exp) | 头部断言 | 如(?<=\bre)\w+\b,查找reading a book时,它匹配ading |
(?<!exp) | 头部否断言 | 如(?<![a-z])\d{7}匹配前面不是小写字母的七位数字 |
引用匹配字符:在后续的匹配和外部程序中,可使用已经匹配的字符作为条件
(Expression) | 内容保存到以数字编号的组里\1,\2 | “(a|b)\1”在匹配“abaa”时,匹配成功,匹配到的结果是“aa” | |
(?<name> Expression) | 内容保存到以name命名的组里 \k<name> |
贪婪与非贪婪:设置数量后,默认是贪婪匹配,就是尽可能匹配多的匹配。在量词后添加?后,改为非贪婪模式。
如源字符串:<div>aaa</div><div>bbb</div>
正则表达式1:<div>.*</div> 匹配结果:<div>aaa</div><div>bbb</div>
正则表达式2:<div>.*?</div> 匹配结果:<div>aaa</div>