正则表达式语法
构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
1、非打印字符
| \f | 匹配一个换页符。 |
| \n | 匹配一个换行符。 |
| \r | 匹配一个回车符。 |
| \s | 匹配任何空白字符,包括空格、制表符、换页符等等。 |
| \S | 匹配任何非空白字符。 |
| \t | 匹配一个制表符。 |
| \v | 匹配一个垂直制表符。 |
| \b | 匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。 |
|---|---|
| \B | 匹配非单词边界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。 |
| \d | 匹配一个数字字符。等价于[0-9]。 |
| \D | 匹配一个非数字字符。等价于[^0-9]。 |
| \w | 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”。 |
| \W | 匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。 |
2、特殊字符
*
代表前面的子表达式至少出现零次。例如pyt*hon,能够匹配py

本文详细介绍了Python中正则表达式的使用,包括非打印字符、特殊字符的含义及用法,如*、.、|、+、?、^、、{}等。同时,讲解了Python的re模块中的关键函数,如match()、search()、sub()和compile(),以及findall()的功能和应用。通过这些内容,读者可以掌握如何在Python中进行高效的数据匹配和处理。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



