python正则表达式——分组的使用

本文通过实例介绍如何使用正则表达式的分组功能来匹配特定格式的字符串,包括电子邮件地址和HTML标签等。文章详细展示了不同类型的分组用法,并解释了如何通过分组名称或索引来获取匹配项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在正则表达式里可以利用分组进行匹配,举例如下:
1.利用分组匹配邮箱地址:

>>> s = "wangbo@163.com"
>>> p = r"(\w{4,20})@(163|qq|gmail|outlook)\.(com)"
>>> result = re.match(p, s)
>>> result.group()
'wangbo@163.com'
>>> result.group(1)
'wangbo'

2.利用分组匹配html标签:分组1和2内容必须相互一致,照应于标记语言的规则。

>>> s = "<html><h1>what the fuck!</h1></html>"
>>> p = r"<(.+)><(.+)>(.+)</\2></\1>"
>>> re.match(p, s)
<_sre.SRE_Match object; span=(0, 36), match='<html><h1>what the fuck!</h1></html>'>
>>> re.match(p, s).group(3)
'what the fuck!'

3.利用取名字的方法进行匹配:类似于分组:

>>> s
'<html><h1>what the fuck!</h1></html>'
>>> p = r"<(?P<key1>.+)><(?P<key2>.+)>(.+)</(?P=key2)></(?P=key1)>"
#取名为key1、key2
>>> re.match(p, s)
<_sre.SRE_Match object; span=(0, 36), match='<html><h1>what the fuck!</h1></html>'>#匹配成功
>>> re.match(p, s).group(3)
'what the fuck!'#输出第三个分组
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangbowj123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值