语法(一)
. 匹配任意字符(除了\n)
[…] 匹配字符集
\d/\D 匹配数字/非数字
\s/\S 匹配空白/非空白字符
\w/\W 匹配单词字符[a-zA-Z0-9]/非单词字符
语法(二)
* 匹配前一个字符零次或者无限次
+ 匹配前一个字符1次或者无限次
? 匹配前一个字符0次或者1次
{m}/{n,m} 匹配前一个字符m次/重复n-m次
*?/+?/?? 匹配模式变为非贪婪(尽可能少匹配字符)
语法(三)
^ 匹配字符串开头
$ 匹配字符串结尾
\A/\Z 指定的字符串必须出现在开头/结尾
| 匹配左右任意一个表达式
(ab) 括号中表达式作为一个分组
\ 引用编号为number的分组匹配到的字符串
(?p) 分组起一个别名
(?P=name) 引用别名为name的分组匹配字符串
Python正则表达式—-re模块其他方法
1:search(pattern,string,flags=0)
在一个字符串中查找匹配
2:findall(pattern,string,flags=0)
找到匹配,返回所有匹配部分的列表
3:sub(pattern.repl,string,count=0,flags=0)
将字符串中匹配正则表达式的部分替换为其他值
4:split(pattern,string,maxsplit=0,flags=0)
根据匹配分割字符串,返回分割字符串组成的列表
正则表达式练习
抓取网页中的图片到本地
1.抓取网页
2.获取网页地址
3.抓取图片内容并保存到本地