由于网络爬虫的时候常常使用正则表达式,所以学习了一下~~
首先,当然是最最最最基本的啦!!!
使用的字符串就是上面这个啦,(随便写的,后面根据需要可能会改)
match:只可以匹配开头的字符(匹配不到返回None)
findall:可以匹配任意位置的字符,并且以列表的形式输出
search:用于查找指定的字符
这里面有两个常用的方法:
span( ):表示匹配到的字符所在字符串所在的收尾位置
group( ):用于获取截获的字符串
- - - - -标志位的使用- - - - -
re.I:可以同时查找大小写
[ ]:中括号的表示方法,可同时匹配多向;Eg:上面代码表示可以匹配a,b,c,d,1,2,3,4。
|:分隔线的使用可以同时匹配多项
先掌握这么多,还有后续哦~~~