常见的通用字符及其含义
字符 | 含义 |
---|---|
\w | 匹配任意一个字母、数字、或下划线 |
\W | 匹配除字母、数字和下划线的任意一个字符 |
\d | 匹配任意一个十进制 |
\D | 匹配除十进制外的任意一个字符 |
\s | 匹配任意一个空白字符 |
\S | 匹配除空字符以外的任意一个其他字符 |
例如:
原子表
字符 | 作用 |
---|---|
[ ] | 取任意一个进行匹配 |
[^ ] | 匹配除方括号内的其他任意字符 |
例如:
元字符
元字符:即正则表达式中有一些特殊含义的字符
字符 | 含义 |
---|---|
. | 匹配除换行符以外的任意字符 |
^ | 匹配字符串的开始位置 |
$ | 匹配字符串结束位置 |
* | 匹配0次、1次或多次前面的原子 |
? | 匹配0次或1次前面的原子 |
+ | 匹配1次或多次前面的原子 |
{n} | 前面的原子恰好出现n次 |
{n,m} | 前面的原子至少出现n次,至多m次 |
丨 | 模式选择”python丨php” |
() | 模式单元符 |
例如:
匹配前面有一个字符后面有三个字符的”python“
边界限制元字符
字符 | 功能 |
---|---|
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
例如:
常见的模式修正符及其含义
字符 | 含义 |
---|---|
I | 匹配时忽略大小写 |
M | 多行匹配 |
L | 做本地化识别匹配 |
U | 根据Unicode字符及解析字符 |
S | 让‘.’匹配包括换行符,即用了该模式修正后‘.’就可以匹配任意字符了 |
贪婪模式与懒惰模式
模式 | 字符 | 功能 |
---|---|---|
贪婪模式 | .* | 尽可能多的匹配 |
懒惰模式 | .*? | 尽可能少的匹配 |
示例: