字符
一,正则表达式的单字符匹配
字符 | 功能 | 示例 | 结果 |
. | 匹配任意1个字符(除了\n) |
|
|
[] | 匹配[ ]中列举的字符 |
| '7' |
\d | 匹配数字,即[0-9] |
| '嫦娥2号' |
\D | 匹配非数字,即不是数字 [^\d] |
| 'abc' |
\s | 匹配空白,即 空格,tab键 [<空格>\t\r\n\f\v] |
| 'a c' |
\S | 匹配非空白 [^\S] |
| 'abc' |
\w | 匹配单词字符,即a-z、A-Z、0-9、_ [a-zA-Z0-9_] |
| 'abc' |
\W | 匹配非单词字符 [^\w] |
| 'a c' |
二,原生字符串
与大多数编程语言相同,正则表达式里使用"\"作为转义字符
,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
Python里的原生字符串很好地解决了这个问题,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。


ret = re.match(r"c:\\a",mm).group() print(ret) 结果:c:\a