python正则表达式二——贪婪模式和预定义字符组

最新推荐文章于 2024-07-09 11:16:00 发布

原创最新推荐文章于 2024-07-09 11:16:00 发布 · 301 阅读

CC 4.0 BY-SA版权

21 篇文章

订阅专栏

本文深入解析正则表达式的各种模式，包括非贪婪与贪婪模式的区别，预定义字符组的使用，以及如何通过实例理解电子邮件地址的匹配。同时，介绍了常用的正则函数如findall, match, search的功能和应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

s='abcadcaecd'
r1=re.findall('ab.*?c',s)	 #非贪婪模式
print(r1)

在这里插入图片描述

贪婪模式即除了非贪婪模式下的三个字符组合，其他的任意组合都是非贪婪模式，即尽可能多地匹配字符

s='abcadcaecd'
r=re.findall('ab.*c',s) #贪婪模式，尽可能多地匹配
print(r)

在这里插入图片描述

s='<a href="asdf">157875456748</a>'
a=re.findall('(\d.*\d)',s)  #前后都是\d才能取到完整数字，中间是贪婪模式
print(a)

在这里插入图片描述

s='<a href="asdf">157875456748</a>'
a=re.findall('\D',s)  
print(a)

在这里插入图片描述

s='fd\tcd\nef\x0b\fjk\r'
a=re.findall('\s',s)
print(a)

在这里插入图片描述

s='fd\tcd\nef\x0b\fjk\r'
a=re.findall('\S',s)
print(a)

在这里插入图片描述

s='重生后123e_fg<a href="asdf">'
a=re.findall('\w',s)
print(a)

在这里插入图片描述

s='重生后123e_fg<a href="asdf">'
a=re.findall('\W',s)
print(a)

在这里插入图片描述

"123456789@qq.com"
要想获取到该邮箱，需分析：

综上：正则表达式为：^\w+@\w+.com$

s='123456789@qq.com'
a=re.findall('^\w+@\w+.com$',s)
print(a)

在这里插入图片描述

re.findall(): 将全部匹配后的内容匹配到一个列表中。
re.match(): 只匹配开头，而且返回的是一个对象，可以通过group（）函数来看返回的字符串。如果分了多个组，要用groups（）函数来获取所有组的内容。

s='cats are cat'
a=re.match('c\w+',s)
b=re.findall('c\w+',s)
c=re.match('(c)(\w+)',s)		//多个组
print(a.group())
print(b)
print(c.groups())

在这里插入图片描述

s='cats are Cat'		//注意两个cat不一样
c=re.search('(C)(\w+)',s)
print(c.groups())

即第一个cat不匹配，但会继续往后找，直到找到匹配的。
在这里插入图片描述