正则表达式(Regular Expressions,简称 regex)是一种强大的文本处理工具,可以用于搜索、替换和解析字符串。Python 的 re
模块提供了对正则表达式的支持。以下是一些基本用法和示例:
导入 re
模块
首先,你需要导入 Python 的 re
模块:
import re
基本匹配
匹配单个字符
.
匹配除换行符以外的任意单个字符。[]
匹配括号内的任意一个字符。例如[abc]
匹配a
、b
或c
。[^...]
匹配不在括号内的任意字符。例如[^abc]
匹配除了a
、b
、c
之外的任意字符。
匹配特定字符集
\d
匹配任意一个数字,等价于[0-9]
。\D
匹配任意一个非数字字符,等价于[^0-9]
。\w
匹配任意一个字母、数字或下划线,等价于[A-Za-z0-9_]
。\W
匹配任意一个非字母、非数字或非下划线字符,等价于[^A-Za-z0-9_]
。\s
匹配任意一个空白字符(如空格、制表符等)。\S
匹配任意一个非空白字符。
匹配数量
*
匹配前面的字符零次或多次。例如a*
匹配a
、aa
、aaa
等。+
匹配前面的字符一次或多次。例如a+
匹配a
、aa
、aaa
等,但不匹配空字符串。?
匹配前面的字符零次或一次。例如a?
匹配a
或空字符串。{n}
匹配前面的字符恰好n
次。例如a{3}
匹配aaa
。{n,}
匹配前面的字符至少n
次