re正则表达式

1.match()方法
向他传入要匹配的字符串及正则表达式,就可以检测正则表达式是否匹配字符串,
它从字符串的起始位置开始匹配字符串,
如果匹配,就返回匹配成功的结果。
2.匹配目标
想从文本中提取一部分内容可以使用()将想要提取的字符串括起来,
()标记了一个字表达式开始和结束的位置,
被标记的每个子表达式会依次对应每一个分组,调用group方法
传入分组的索引即可获取提取的结果,
import re
content = ‘Hello 1234566 World_this is a regex demo’
result = re.match(‘Hello\s(\d+)\sWorld’,content)
print(result)
print(result.group())
print(result.group(1))
print(result.span())
将字符串中的数字提取出来,可将数字部分的正则表达式用()括起来,
后调用group(1)获取匹配结果
3.通用匹配"."
"."代表可以匹配任意字符(除了换行符),
”代表匹配前面的字符无限次,
"."组合在一起可以匹配任意字符
4.贪婪和非贪婪
".
"组合在一起可以匹配任意字符,它是贪婪匹配,即匹配竟可能多的字符,
".*?"非贪婪匹配,即尽可能匹配少的字符。
5.修饰符
修饰符是可选的它可以用来控制匹配的模式。
re.I    使匹配对大小写不敏感
re.L   做本地化识别(local-aware)匹配
re.M  多行匹配,影响^和$
re.S   使.匹配包括在内的所有字符
re.U  根据Unicode字符集解析字符,这个标志影响\w,\W,\b和\B
re.X   可以使正则表达式写得更易于理解
在网页匹配中,常用re.S和re.I
6.search()方法
使用match()方法是在待匹配的字符串开头开始匹配,如果开头不匹配就会则匹配失败,
使用search()方法在匹配时会扫描整个字符串,
后返回第一个成功匹配的的结果。
7.findall()方法
search()方法可以返回匹配正则表达式的第一个内容,如果想获取匹配正则表达式的所有内容可以使用findall()方法
8.sub()方法
sub()方法可以修改文本
9.compile()方法
compile方法是用来处理字符串的方法,该方法将正则字符串编译成正则表达式对象,以便复用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值