Python3-正则表达式~贪婪模式与非贪婪模式

本文通过两个字符串示例介绍了Python中正则表达式的使用方法,特别是如何运用贪婪与非贪婪模式来匹配HTML标签。展示了不同模式下<div>标签及其内部文本的匹配差异。
import re

str1 = r'aa<div>test1</div>bb<div>test2</div>cc'

str2 = r'aa<div>test1<div>test2</div></div>cc'

#贪婪模式
pattern=re.compile(r'<div>.*</div>')
s=pattern.search(str1)
print(s)
#非贪婪模式1
pattern=re.compile(r'<div>.*?</div>')
s=pattern.search(str1)
print(s)
#非贪婪模式2
pattern=re.compile(r'<div>.*?</div>')
s=pattern.search(str2)
print(s)

/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/apple/PycharmProjects/stage4/spider/2018——0307/re_tanlan.py
<_sre.SRE_Match object; span=(2, 36), match='<div>test1</div>bb<div>test2</div>'>
<_sre.SRE_Match object; span=(2, 18), match='<div>test1</div>'>
<_sre.SRE_Match object; span=(2, 28), match='<div>test1<div>test2</div>'>


Process finished with exit code 0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值