首先我先要安利一个超级好用的网站,用来验证和学习正则表达式
https://regexr.com/
1、re.match和re.search有什么区别
import re
print(re.match('www', 'www.runoob.com')) # 在起始位置匹配
print(re.match('com', 'www.runoob.com')) # 不在起始位置匹配
print(re.match('\d{2}','123-456-789'))
str='123-456-7hjsbxjdgkjas928'
print(re.search('\d',str))
print(re.search('\d{2,5}',str))
re.match 只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回 None,而 re.search 匹配整个字符串,直到找到一个匹配。
2、符号
. 匹配任意字符
\d 数字 [0-9]
\w 单词字符 [A-Za-z0-9]
\s 空白字符 [<空格>\t\r\n\f\v]
* 匹配前一个字符零次或无限次,贪婪模式
+ 匹配前一个字符1次或无限次
? 匹配前一个字符0次或1次
{m} 匹配前一个字符m次
{m,n} 匹配前一个字符m至n次
{,n} 匹配前一个字符0次到n次
{m,} 匹配前一个字符m次到无限次
^ 匹配字符串的开头,在多行模式中匹配每一行的开头
$ 匹配字符串的末尾,在多行模式中匹配每一行的末尾
\A 仅匹配字符串的开头
\Z 仅匹配字符串的末尾
**逻辑、分组**
| 代表左右表达式任意匹配一个,先尝试匹配左侧的表达式,一旦匹配成功则跳过匹配右侧的表达式
() 被括号括起来的是一个分组,每遇到一个(左括号,括号编号+1
(?P<name>...) 分组除了原有的边界之外,可以指定一个别名 eg: (?P<id>abc){2}