Python 字符串处理:re 与 string 模块详解
1. re 模块简介
re 模块用于在字符串中执行正则表达式的模式匹配和替换操作,支持 Unicode 和字节字符串。正则表达式模式通常是包含文本和特殊字符序列的字符串,由于模式中常大量使用特殊字符和反斜杠,所以一般写成“原始”字符串,如 r'(?P<int>\d+)\.(\d*)' 。
2. 正则表达式模式语法
正则表达式模式中识别以下特殊字符序列:
| 字符 | 描述 |
| ---- | ---- |
| text | 匹配字面字符串 text |
| . | 匹配除换行符外的任何字符 |
| ^ | 匹配字符串的开头 |
| $ | 匹配字符串的结尾 |
| * | 匹配前一个表达式零次或多次,尽可能多地匹配重复项 |
| + | 匹配前一个表达式一次或多次,尽可能多地匹配重复项 |
| ? | 匹配前一个表达式零次或一次 |
| ? | 匹配前一个表达式零次或多次,尽可能少地匹配重复项 |
| +? | 匹配前一个表达式一次或多次,尽可能少地匹配重复项 |
| ?? | 匹配前一个表达式零次或一次,尽可能少地匹配重复项 |
| {m} | 精确匹配前一个表达式 m 次 |
| {m, n} | 匹配前一个表达式 m 到 n 次,尽可能多地匹配重复项。若省略 m,默认值为 0;若省略 n,默认值为无穷大 |
| {m, n}? | 匹配前一个表达式 m 到 n 次,尽可能少地匹配重复项 |
| […]
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



