正则表达式
基本方法:
- 点号(.):一个点号可以替代除了换行符以外的任何字符
- 星号(*):一个星号可以表示它前面的一个子表达式(普通字符,另一个正则表达式符号)0次到无限次
- 点星(.*):如果a.*b,表示ab之间可以任意除换行符的字符
- 问号(?):表示它前面的子表达式0次或者1次
- 反斜杠(\):反斜杠不单独使用,把特殊字符变成普通字符,把普通字符变为特殊字符
转义字符 | 意义 |
---|---|
\n | 换行符 |
\t | 制表符 |
\ | 普通反斜杠 |
’ | 单引号 |
‘’ | 双引号 |
\d | 数字 |
- 小括号():小括号可以把括号内的内容提取出来
#导入正则表达式
import re
7 (.)和(.?)的区别:
前者贪婪模式,获取最长满足条件字符串;
后者非贪婪模式,获取最短的能满足条件的字符串。
关键字:
#pattern为正则表达式,string原字符串,flg是辅助功能,可以省略
re.findall(pattern,string,flags=0) #找出所有满足要求的字符串
a = re.search(pattern,string,flags=0) #找出第一个满足要求的字符串停止搜索
a.group() #获取search方法,结果