【正则】详解python正则表达式之re.match()与re.search()的用法

原创已于 2024-12-04 20:22:32 修改 · 4.4k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#正则表达式 #python #开发语言

于 2022-07-04 13:56:57 首次发布

Python开发教程专栏收录该内容

35 篇文章

订阅专栏

在 Python 的正则表达式操作领域，re.match 和 re.search 是两个极为常用且重要的函数，它们均隶属于 re 模块，用于在文本中执行正则表达式匹配操作，但二者在匹配行为和应用场景上存在着显著的差异。深入理解这两个函数的特性、用法以及区别，对于高效处理文本数据、实现精准的模式匹配任务具有至关重要的意义。

1、re.match()的用法

re.match()方法是从起始位置开始匹配一个模式，匹配成功返回一个对象，未匹配成功返回None。

语法：

re.match(pattern, string, flags=0)

参数说明：

pattern：匹配的正则表达式；

string：要匹配的字符串；

flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等；

示例如下：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import re

if __name__ == '__main__':
    # 匹配模式
    test_pattern = r"\d{2}年"
    # 待匹配的字符串
    test = "18年2019年2020年"
    print(re.match(test_pattern, test).group())

输出：

18年

Process finished with exit code 0

若将匹配模式改成：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import re

if __name__ == '__main__':
    # 匹配模式
    test_pattern = r"\d{4}年"
    # 待匹配的字符串
    test = "18年2019年2020年"
    print(re.match(test_pattern, test))

则返回结果为：

None

Process finished with exit code 0

这是因为re.match()仅从头开始匹配，由于起始位置处未找到符合匹配模式的内容，返回None。

2、re.search()的用法

re.search()方法是扫描整个字符串内进行模式匹配，只要找到第一个匹配就返回，如果字符串没有匹配，则返回None。

语法：

re.search(pattern, string, flags=0)

参数说明：

pattern：匹配的正则表达式；

string：要匹配的字符串；

flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等；

示例如下：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import re

if __name__ == '__main__':
    # 匹配模式
    test_pattern = r"\d{4}年"
    # 待匹配的字符串
    test = "18年2019年2020年"
    print(re.search(test_pattern, test).group())

输出：

2019年

Process finished with exit code 0

这是因为re.search()扫描整个字符串，找到符合匹配模式的第一个匹配就返回了。

3、re.match()与re.search()的区别

re.match()方法要求必须从字符串的开头进行匹配，如果字符串开头不符合模式规则，整个匹配就失败了，函数返回None；

re.search()并不要求必须从字符串的开头进行匹配，而是扫描整个字符串，直到找到第一个匹配。

匹配起始位置：re.match 只从字符串的开头进行匹配，而 re.search 会在整个字符串中搜索匹配正则表达式模式的部分。
应用场景：如果确定要匹配的内容一定在字符串开头，或者只关心字符串开头的匹配情况，可以使用 re.match；如果需要在整个字符串中查找匹配的模式，无论其位置如何，则应使用 re.search。例如，在验证一个字符串是否以特定的协议开头（如 "http://" 或 "https://"）时，可以使用 re.match；而在一篇文章中查找某个关键词时，就需要使用 re.search。

总结与最佳实践

re.match 和 re.search 是 Python 正则表达式处理中的重要工具，它们各自具有独特的匹配行为和应用场景。在实际编程中，开发者应根据具体的任务需求来选择合适的函数。
如果需要确定一个字符串是否以特定的模式开头，应优先考虑使用 re.match；若要在整个文本中查找某个模式的首次出现位置，则 re.search 是更为合适的选择。同时，在使用这两个函数时，还需注意合理设置正则表达式模式和匹配标志，以确保能够准确地实现预期的匹配效果。此外，为了提高代码的可读性和可维护性，建议在代码中添加适当的注释，说明正则表达式的用途和匹配逻辑，以便后续的开发和维护工作能够顺利进行。
通过深入理解 re.match 和 re.search 的特性和区别，并结合实际应用场景灵活运用，能够在 Python 文本处理和正则表达式操作中更加游刃有余，高效地解决各种复杂的文本匹配和分析问题，提升程序的质量和性能。