Python中的正则表达式模块是re模块,它提供了一系列用于处理正则表达式的方法和函数。
常用的正则表达式符号:
\d: 匹配任意数字。
\D: 匹配任意非数字字符。
\w: 匹配任意字母、数字或下划线。
\W: 匹配任意非字母、数字或下划线字符。
\s: 匹配任意空白字符。
\S: 匹配任意非空白字符。
\b: 匹配单词的边界。
^: 匹配字符串的起始位置。
$: 匹配字符串的结束位置。
*: 匹配前面的元素零次或多次。
+: 匹配前面的元素一次或多次。
?: 匹配前面的元素零次或一次。
re 库采用 raw string 类型表示正则表达式,不包含转义符的字符串。表示为 r’text’
例如:r’[1-9]\d{5}’
r’ \d{3}- \d{8}| \d{4}- \d{7}’
string 类型,更繁琐。
例如:’[1-9] \d{5}’
’\d{3}-\d{8}| \{4}-\d{7}’
常见的正则表达式应用场景
-
查找匹配的字符串:re.search(pattern, string)方法用于在字符串中搜索匹配的内容,并返回第一个匹配的对象。pattern是正则表达式,string是要搜索的字符串。
示例:
import re # 在字符串中查找是否有数字 resul