正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
特殊字符
字符 | 含义 |
---|---|
^ | 匹配输入字符串的开始位置,在方括号表达式中使用时表示取非 |
$ | 匹配输入字符串的结尾位置 |
() | 标记一个子表达式的开始和结束位置 |
[] | 标记一个中括号表达式的开始 |
. | 匹配除换行符 \n 之外的任何单字符 |
限定符
字符 | 含义 |
---|---|
+ | 匹配前面的子表达式一次或多次 |
? | 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符 |
* | 匹配前面的子表达式零次或多次 |
{m} | 匹配前面的表达式m次 |
{m,} | 至少匹配前面的表达式m次 |
{m,n} | 匹配前面的表达式至少m次,至多n次 |
非打印字符
字符 | 含义 |
---|---|
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等 |
\S | 匹配任何非空白字符 |
\w | 匹配字母或数字或下划线或汉字 |
\W | 匹配特殊字符,即非 字母或数字或下划线或汉字 |
\d | 匹配 数字 |
\D | 匹配 非数字 |
常用正则表达式