贪婪匹配与非贪婪匹配的区别

最新推荐文章于 2025-09-22 12:45:00 发布

原创最新推荐文章于 2025-09-22 12:45:00 发布 · 453 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#正则表达式

python基本语法专栏收录该内容

2 篇文章

订阅专栏

本文介绍了正则表达式中的两种匹配策略：贪婪匹配与非贪婪匹配。通过实例讲解了这两种策略的区别，即贪婪匹配会尽可能多地匹配字符，而非贪婪匹配则尽可能少地匹配字符。

贪婪匹配：

+，?，*，{n}，{n,}，{n,m}

匹配时，如果遇到上述标识符，代表是贪婪匹配，会尽可能多的去匹配内容.

下面是贪婪匹配的示例：

content = 'Xiaoshuaib has 102 bananas'

#贪婪匹配:
res1 = re.findall('^Xi.*(\d+).*$',content) 
#直到遇到最后一个符合条件的(/d)为止，这时遇到最后一个符合条件的元素是2 -> 2
----------------------out----------------------
res1: ['2']

非贪婪匹配：

尽量匹配少的内容，一旦碰到第一个符合条件的元素就不再继续向后匹配

标识符：
+?，??，*?，{n}?，{n,}?，{n,m}?
（在贪婪标识符后面加？）

res2 = re.findall('^Xi.*?(\d+).*$',content) 
#非贪婪匹配，遇到第一个符合条件的元素就放弃匹配，第一个符合条件的元素是1 -> 102
-------------------out------------------
res2: ['102']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

死美子

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

正则表达式:贪婪匹配与非贪婪匹配

墨痕诉清风的博客

07-06

1349

情景之前写过一个简单的爬虫，每天获取公司insgtagram主页的粉丝数用来进行粉丝趋势的展示。代码很简单就是通过获取主页源代码后用正则表达式匹配其中的一串json数据，再用python的json解析库进行解析，从中获取粉丝数。然而昨天这个爬虫报错了，我重新看了一下ins主页的网页源代码，发现其中增加了一段内容，这段内容正好被我匹配进去了。经过思考显而易见，这是贪婪匹配的问题。贪婪匹配与非贪婪匹配现在这些术语听起来都很吓人，其实这是正则匹配的两种模式，很容易解释：贪婪匹配：尽可能匹配最长

正则表达式规则以及贪婪匹配与非贪婪匹配详解

dvlinker的技术专栏

06-11

1498

正则表达式规则以及贪婪匹配与非贪婪匹配详解

参与评论您还未登录，请先登录后发表或查看评论

贪婪匹配和非贪婪匹配

happyCoding1024的博客

10-10

3050

贪婪匹配和非贪婪匹配 1. 贪婪匹配在JS中利用正则表达式时，默认的匹配就是贪婪匹配，也就是尽可能多的去匹配，举个例子： var s = 'aaa'; var regexp = /a+/; // 匹配1个或多个a,贪婪匹配 console.log(regexp.exec(s)[0]); // 'aaa' 在上面的例子中，匹配到了 'aaa' 。 2. 非贪婪匹配我们同样可以进行非贪婪匹配只需...

36-正则表达式高级：分组、贪婪匹配、非贪婪匹配

最新发布

嵌入式面试大全

09-22

453

本文介绍了正则表达式的高级技巧，重点讲解了分组功能（捕获组、非捕获组、命名分组）和分组引用方法，以及贪婪匹配与非贪婪匹配的区别。通过Python代码示例演示了如何提取日期信息、HTML内容、日志数据等实用场景，并展示了命名分组和格式转换的应用。文章还提供了使用re.VERBOSE标志提高正则表达式可读性的技巧，帮助开发者更高效地处理复杂文本匹配和提取任务。这些高级技巧能显著提升文本处理能力，适用于数据分析、日志解析等多种场景。

【贪婪匹配】和【非贪婪匹配】

dong_dong222的博客

03-31

506

在学到正则的时候，看到了贪婪匹配，感觉又是什么高深莫测的术语，其实不然。贪婪匹配：尽可能匹配最长的字符串 非贪婪匹配：尽可能匹配最短的字符例如：ga<div>8901</div>bb<div>test2</div> 如果想要匹配一个完整的div，贪婪模式的结果为： <div>8901</div>bb<div>test2</div> 非贪婪模式的结果为： <div>8901</d

正则表达式的贪婪匹配(.*)和非贪婪匹配(.*?)

仓

01-16

1307

.*? 正则引擎默认是贪婪的，当出现"*"时,它会尽量去匹配尽可能长的字符串一个用于修正以上问题的可能方案是用"*"的惰性代替贪婪性。你可以在"*"后面紧跟一个问号"?"来达到这一点这告诉正则引擎，尽可能少的重复上一个字符

JavaScript正则表达式的贪婪匹配和非贪婪匹配

12-08

非贪婪匹配则是与贪婪匹配相反，它会尽可能少地匹配字符。非贪婪模式的实现是在量词后面添加一个问号（`?`），如`/a+?/`。在同样的字符串"aaaaa"中，非贪婪匹配的`/a+?/`只会匹配第一个'a'，因此返回结果为`["a"]`...

C++正则表达式规则以及贪婪匹配与非贪婪匹配

dvlinker的技术专栏

02-11

2万+

正则表达式规则，以及贪婪匹配与非贪婪匹配

python re模块匹配贪婪和非贪婪模式详解

09-17

### Python re 模块匹配贪婪与非贪婪模式详解 #### 一、引言在进行文本处理时，正则表达式是一种极其强大的工具。Python 的 `re` 模块提供了支持正则表达式的功能，使得开发者能够高效地完成字符串搜索、替换等...

贪婪匹配和非贪婪匹配的区别

ningyanggege的博客

06-16

740

区别如下所示： import re text = "<a> 你好 </a> <a> hello </a>" re_pat = "<a>.* </a>" re.findall(re_pat, text) ['<a> 你好 </a> <a> hello </a>'] text = "<a> 你好 </a> <a> hello </a>.

正则表达式贪婪与非贪婪模式

u011910350的博客

10-21

824

1.什么是正则表达式的贪婪与非贪婪匹配　　如：String str="abcaxc"; 　　　　Patter p="ab*c"; 　　贪婪匹配:正则表达式一般趋向于最大长度匹配，也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str，结果就是匹配到：abcaxc(ab*c)。　　非贪婪匹配：就是匹配到结果就好，就少的匹配字符。如上面使用模式p匹配字符串str，结果就是匹配到：abc(a

正则基础之——贪婪与非贪婪模式

热门推荐

雁过无痕

11-02

11万+

1 概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为，贪婪模式在整个表达式匹配成功的前提下，尽可能多的匹配，而非贪婪模式在整个表达式匹配成功的前提下，尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。属于贪婪模式的量词，也叫做匹配优先量词，包括：“{m,n}”、“{m,}”、“?”、“*”和“+”。在一些使用NFA引擎的语言中，在匹配优先量词后加上“

正则表达式的贪婪匹配和非贪婪匹配

一纸春秋的博客

10-11

2781

正则表达式默认是贪婪匹配，即每个规则都尽可能多的匹配 非贪婪匹配的每个规则具体匹配到哪里，可以总结为尽可能少的匹配匹配到下一个规则为止来看例子 package RegularExpression; import java.util.regex.Matcher; import java.util.regex.Pattern; public class demo5 { public static void main(String[] args) { //正则表达式的贪婪匹配

正则表达式-贪婪与非贪婪匹配

icy_xm的专栏

12-12

2353

+贪婪匹配与非贪婪匹配贪婪匹配默认情况下，正则表达式使用最长匹配原则（也叫贪婪匹配原则）。例如：要将"zoom"中匹配"zo?"的部分替换成"r",替换的的结果是"rom"。如果要将"zoom"中匹配"zo*" 的部分替换成"r",替换后的结果是"rm"。 非贪婪匹配当字符？紧随其他限定符（*、+、？、{n}、{n,}、{n,m}）之后时，匹配模式变成了最短匹

python 贪婪匹配与非贪婪匹配

孤的博客

05-14

1782

贪婪匹配

【正则表达式】贪婪匹配与非贪婪匹配

学习笔记。

02-07

4282

例：匹配输入串A: 101000100 贪婪匹配：使用 1.*1 将会匹配到1010001 非贪婪匹配：使用 1.?1 将会匹配到101

【Python零基础入门篇 · 39】：贪婪匹配和非贪婪匹配、原生字符串

Oh_Python的博客

09-14

963

在满足匹配时，匹配尽可能长的字符串，默认情况下，采用贪婪匹配。：在满足匹配时，匹配尽可能短的字符串，使用“?”来表示非贪婪匹配。

正则表达式之贪婪匹配与非贪婪匹配

08-12

### 贪婪匹配与非贪婪匹配的区别贪婪匹配和非贪婪匹配是正则表达式中两种不同的匹配策略，它们决定了正则表达式引擎如何处理重复量词（如 `*`、`+`、`?`、`{m,n}`）的行为。在贪婪匹配模式下，正则表达式引擎会尽可能多地匹配字符，直到无法继续匹配为止。例如，对于字符串 `aabbaabba` 和正则表达式 `a.*a`，贪婪匹配会匹配整个字符串，因为它试图找到最长的匹配项[^3]。相反，非贪婪匹配（也称为懒惰匹配）会尽可能少地匹配字符，只要满足条件就立即停止。为了启用非贪婪模式，可以在量词后面添加一个问号 `?`。例如，正则表达式 `a.*?a` 会匹配 `aabba` 和 `aabba`，而不是整个字符串[^2]。 ### 贪婪匹配与非贪婪匹配的用法在正则表达式中，默认情况下所有的量词都是贪婪的。这意味着像 `*`、`+`、`?` 和 `{m,n}` 这样的量词会尽可能多地匹配字符。如果需要改变这种行为，可以通过在量词后加上 `?` 来启用非贪婪模式。以下是一些常见的贪婪和非贪婪量词的对比： | 贪婪量词 | 非贪婪量词 | 描述 | |----------|------------|------| | `*` | `*?` | 匹配零次或多次，非贪婪模式下尽可能少匹配 | | `+` | `+?` | 匹配一次或多次，非贪婪模式下尽可能少匹配 | | `?` | `??` | 匹配零次或一次，非贪婪模式下尽可能少匹配 | | `{m,n}` | `{m,n}?` | 匹配 m 到 n 次，非贪婪模式下尽可能少匹配 | ### 示例代码以下是一个使用 Python 的正则表达式模块 `re` 的示例，演示了贪婪匹配和非贪婪匹配的不同结果： ```python import re text = "aabbaabba" # 贪婪匹配 greedy_match = re.search(r'a.*a', text) print("Greedy match:", greedy_match.group()) # 非贪婪匹配 non_greedy_match = re.search(r'a.*?a', text) print("Non-greedy match:", non_greedy_match.group()) ``` 输出结果将是： ``` Greedy match: aabbaabba Non-greedy match: aabba ``` 在这个例子中，贪婪匹配 `a.*a` 匹配了整个字符串，而非贪婪匹配 `a.*?a` 只匹配了第一个可能的子串 `aabba`。 ### 贪婪匹配与非贪婪匹配的应用场景贪婪匹配通常用于需要尽可能多匹配的情况，例如提取大段文本中的内容。而非贪婪匹配则适用于需要精确匹配最小可能部分的情况，例如提取 HTML 或 XML 标签之间的内容。例如，假设有一个 HTML 片段 `<div>Content1</div><div>Content2</div>`，想要提取每个 `<div>` 标签中的内容，可以使用非贪婪匹配来确保每个 `<div>` 标签的内容被单独提取出来： ```python html = "<div>Content1</div><div>Content2</div>" matches = re.findall(r'<div>(.*?)</div>', html) print("Matches:", matches) ``` 输出结果将是： ``` Matches: ['Content1', 'Content2'] ``` 在这个例子中，非贪婪匹配 `.*?` 确保了每个 `<div>` 标签的内容被单独提取出来，而不是匹配整个字符串。 ### 总结贪婪匹配和非贪婪匹配是正则表达式中非常重要的概念，理解它们的区别和使用方法可以帮助更有效地处理字符串匹配和提取任务。通过合理选择贪婪或非贪婪模式，可以更好地控制正则表达式的匹配行为，从而得到预期的结果。