Python match-search-findall-group(s)的区别

最新推荐文章于 2025-07-15 11:15:07 发布

转载最新推荐文章于 2025-07-15 11:15:07 发布 · 518 阅读

·

0

·

Python 同时被 2 个专栏收录

30 篇文章

订阅专栏

12 篇文章

订阅专栏

本文详细解析了Python正则表达式中的match、search、findall、group(s)和groupdict的功能与使用场景，通过实例展示了如何从字符串中精确查找、匹配和提取数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转自https://www.cnblogs.com/mosson/articles/5828433.html

match、search、findall、group(s) 区别

1

2

3

4

5

import re

# match findall经常用

# re.match() #从开头匹配，没有匹配到对象就返回NONE

# re.search() #浏览全部字符，匹配第一个符合规则的字符串

# re.findall() # 将匹配到的所有内容都放置在一个列表中

一、match有两种情况

------- 有分组 ------取匹配到的正则再次取其部分内容

1

2

3

4

5

6

origin = "hello alex sadf dsaf"

r = re.match("(h)\w+",origin)

print(r.group()) # hello 获取匹配所有结果

print(r.groups()) #('h',) #获取模型中匹配到的分组没有分组则为空元组

r = re.match("(?P<n1>h)(?P<n2>\w+)",origin) #获取模型中匹配到的分组中所有执行力key的组 ?P<KEY>VALUE {'n2': 'ello', 'n1': 'h'}

print(r.groupdict()) #?P<KEY>VALUE {'n2': 'ello', 'n1': 'h'}

------- 无分组 ------

1

2

3

4

r = re.match("h\w+",origin)

print(r.group()) # 获取匹配所有结果 hello

print(r.groups()) #获取模型中匹配到的分组 ()

print(r.groupdict()) #获取模型中匹配到的分组 {}

二、groups、group、groupdict

1

2

3

4

print(r.group()) # hello 获取匹配所有结果

print(r.groups()) #('h',) #获取模型中匹配到的分组没有分组则为空元组

r = re.match("(?P<n1>h)(?P<n2>\w+)",origin) #获取模型中匹配到的分组中所有执行力key的组 ?P<KEY>VALUE {'n2': 'ello', 'n1': 'h'}

print(r.groupdict()) #?P<KEY>VALUE {'n2': 'ello', 'n1': 'h'}

三、search两种情况

search 不用从开头匹配，而是匹配全局整个字符串，一旦又符合就退出

------- 有分组 ------

1

2

3

4

5

6

origin = "hello alex alix bcd dsfa lefg abc 199"

r = re.search("a(\w+)",origin)

print(r.group()) #alex

print(r.groups()) #('lex',)

r = re.search("(?P<key1>a)(?P<key2>(\w+))",origin)

print(r.groupdict()) #{'key1': 'a', 'key2': 'lex'}

------- 无分组 ------

1

2

3

4

5

origin = "hello alex alix bcd dsfa lefg abc 199"

r = re.search("ali\w+",origin)

print(r.group()) #alix

print(r.groups()) #()

print(r.groupdict()) #{}

四、findall

# 1 匹配到之后，就抽离，继续从下一个字符开始匹配

1

2

3

origin = "a2b3c4d5"

a=re.findall("\d+\w\d+",origin) #['2b3', '4d5']

print(a)

# 2 空值也会挨个字符去匹配，结尾后，还要继续多匹配一次

1 2	`num` `=` `"asd"` `print(re.findall("",num))` `# ['', '', '', '']`

# 无分组

1

2

3

4

5

origin = "hello alex alix bcd dsfa lefg abc 199"

print(re.findall("a\w+",origin)) # ['alex', 'alix', 'abc']

print(re.findall("(a\w+)",origin)) #['alex', 'alix', 'abc']

print(re.findall("a(\w+)",origin)) #组 groups ['lex', 'lix', 'bc']

print(re.findall("(a)(\w+)(x)",origin)) # [('a', 'le', 'x'), ('a', 'li', 'x')] 将三个分组匹配到的做成元组放到列表作为一个元素

findall 的特点

1

2

3

4

5

6

7

8

9

10

11

分组匹配

* 贪婪匹配：比如如下的asd 为一个分组，而一旦遇到asd开始的字符串，如果

后面还是asd也会匹配，这就是贪婪匹配。

findall 特性：

1 有几个分组返回几个内容：,并将返回内容放到元组内作为列表的一个元素。

2 即尽管* 匹配到了两个asd ，但是因为是贪婪虚拟匹配出的，有一个分组，所以，

只会，取一个。

3 而findall默认只取最后一组匹配的内容，故此只返回最后一组asd

4 findall 如果正则能有空的匹配的话，那么匹配字符串最后还会匹配到一个空

5 多个分组匹配到做成元组，当成列表的一个元素

6 多个分组，查找顺序，外到内，左到右 ((\w)(\w)){2,} 先是找到2个字母的，再在这两个字母里面进行局部分组

# 1 特性 1 2 3 4

1	`print(re.findall(r'(asd)*','asdasd'))` `#['asd', '']`

# 2 如下，默认+可以第一次就匹配到 1asd2asd 但由于前面只有1个分组，只能返回后面的4位了

1 2	`n` `=` `re.findall("(\dasd)+","1asd2asdp2asds")` `# ['2asd', '2asd']` `print(n)`

# 3 如下，默认*可以第一次就匹配到 1asd2asd 但由于前面只有1个分组，只能返回后面的4位了

　　#但是*还可以表示0次，故再遇到p的时候，空就能匹配了，而且，最后还有个s也匹配到空，结尾还默认还会匹配到空

1 2	`n` `=` `re.findall("(\dasd)*","1asd2asdp2asds")` `# ['2asd', '', '2asd', '', '']` `print(n)`

#4 匹配，最多四个字母，因此alex都找到了，但是只有一个分组，所以只返回最后一个\w故x

1

2

3

a = "alex"

n = re.findall("(\w){4}",a)

print(n) # ['x']

#5 这里findall 匹配分组是一个字母匹配到了，而*是贪婪匹配，四个字母都匹配就取到了四个字母，而正则分组只有一个，因此只取最后一个

1

2

3

a = "alex"

n = re.findall("(\w)*",a)

print(n) # ['x', '']

#6 由于从外到内，所以匹配两个字母的 al 匹配到了，ex也匹配到了，外部分组1个，因此ex，而内部从左到右又会匹配。

1

2

3

a = "alex"

n = re.findall("((\w)(\w)){2,}",a)

print(n) # [('ex', 'e', 'x')]

#7 会匹配ax alex alex acd 但是贪婪匹配的分组只有 1个因此 ax ax ax ad

1

2

3

origin = "hello ax lex bed alex lge alex acd 19"

n = re.findall("(a)(\w)*" , origin)

print(n) #[('a', 'x'), ('a', 'x'), ('a', 'x'), ('a', 'd')]

博客等级

码龄13年

29
原创

64
点赞

250
收藏

9
粉丝

关注

私信

热门文章

分类专栏

环境配置 12篇
Conda 9篇
VSCODE 4篇
学习资源推荐 4篇
开源社区 1篇
阅读笔记 2篇
深度学习 3篇
面向对象 3篇
CUDA 1篇
网络编程 2篇
ARM9 1篇
Python 30篇
文本处理 12篇
数理基础 11篇
NLP 10篇
Sklearn 1篇

展开全部收起

上一篇：: Python正则表达式快速入门

下一篇：: gensim corpora的简单使用

最新评论

推荐这六本关于机器学习的书籍，并说说它们的优缺点
qq_53100510: 请问哪里能找到推荐五的pdf呢
簇大小与分区4k对齐的关系
james旸爷: 4k没啥用。
多项分布的指数分布族形式的一个小坑
优快云-Ada助手: 感谢博主分享关于多项分布的指数分布族形式的小坑，这对我们了解多项分布的指数分布族形式有很大帮助。对于技术博客的写作，建议博主可以分享一下“如何在机器学习中使用多项分布的指数分布族形式”。这样的博客不仅可以帮助读者深入了解多项分布的指数分布族形式，更可以帮助大家更好地应用到实际工作中。期待博主的下一篇精彩博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.youkuaiyun.com/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.youkuaiyun.com/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
图说行列式：几张图让你明白行列式的性质
瑾言-自强不息: 博主写得很好，很用心，将行列式的概念进行了深刻的分析，我看懂了，而且不禁感叹，太神奇了，数学太有魅力了
LDA困惑度perplexity的一些个人理解
ElienC: 我想可以用于比较不同的batch size、迭代次数、收敛条件、随机种子等等

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。