正则表达式功能比较强大,而且相对简单,关键是普适。但是也比较难记住这些个点,现在收录一下。
分类
普通字符 a-z A-Z 0-9
特殊字符/通配符/元字符 + * ? \d \D \w \W \s \S ^
介绍
. 匹配除换行之外的任何一个字符
- 匹配前面子表达式规则字符任意次数(至少出现一次)
- 匹配前面子表达式规则字符任意次数包含0次
? 尽可能少匹配,禁止贪婪模式
\d 匹配一个数字
\D 匹配一个非数字
\w 匹配包含下划线的任何单词字符
\W 匹配任何非单词字符
\s 匹配任何空白字符
\S 匹配任何非空白字符
^ 字符串开头匹配
$ 字符串结束匹配
[] 筛选条件 使用‘|’也可以
() 分组(作为一个整体)只输出()内的部分
{} 出现次数 范围/固定 {3}出现3次; {3,5}出现3-5次
与[]搭配使用代表“非”,如[a]表示非a全取
其他
Python中的几个重要参数和方法
re.M 多行取值;re.S 回行也取
import re
re.findall()
re.match()