python —— 正则表达式

本文介绍正则表达式的高效使用方法,包括查找分析字符串、验证字符串格式等实用技巧。通过实例展示如何利用Python内置模块re进行字符串匹配、替换及拆分操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作用

快速高效的查找和分析字符串. 也可以用于验证一个字符串是否符合某个给定的规则.


示例

描述一个或多个空白符的regex是\s+:

In [81]: import re

In [82]: text="foo   bar\t baz \tqux"

In [83]: re.split('\s+',text)
Out[83]: ['foo', 'bar', 'baz', 'qux']

可以用re.compile( )编译regex以得到一个可重用的regex对象

In [84]: regex=re.compile('\s+')

In [86]: regex.split(text)
Out[86]: ['foo', 'bar', 'baz', 'qux']

得到匹配regex的所有格式

In [87]: regex.findall(text)
Out[87]: ['   ', '\t ', ' \t']

扫描整个字符串以匹配模式,如果找到则返回一个匹配项对象

In [105]: m=regex.search(text)

In [106]: m.span() //span()会显示匹配到的下标
Out[106]: (3, 6)

In [107]: text[m.start():m.end()]
In [108]:

将匹配到的模式替换成指定字符串

In [108]: text
Out[108]: 'foo   bar\t baz \tqux'

In [109]: regex.sub(':',text)
Out[109]: 'foo:bar:baz:qux'

正则表达式方法
方法说明
findall、finditer返回字符串中所有的非重叠匹配模式
search扫描整个字符串以匹配模式
match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None
split根据找到的模式将字符串拆分成数段
sub将字符串中所有的(sub)或前n个(subn)模式替换成指定表达式
### Python 正则表达式使用教程 #### 导入 `re` 模块 为了在 Python 中使用正则表达式,需要先导入内置的 `re` 模块。该模块提供了多种用于处理正则表达式的函数和方法。 ```python import re ``` #### 基本语法介绍 正则表达式由字符序列组成,这些字符序列描述了字符串的模式[^1]。以下是几个常见的元字符及其含义: - `.` 匹配除换行符以外的任意单个字符。 - `*` 表示前面的字符可以出现零次或多次。 - `+` 表示前面的字符至少出现一次。 - `?` 表示前面的字符最多只会出现一次(即可能不出现)。 - `[]` 定义一个字符集,匹配其中任何一个字符。 - `()` 将多个元素组合成一个单元。 - `{m,n}` 表示前一项最少重复 m 次,最多 n 次。 #### 函数说明 ##### 查找所有匹配项——findall() 此函数返回列表形式的所有非重叠匹配项。如果未找到任何匹配,则返回空列表。 ```python result = re.findall(r'\d+', 'hello 123 world 456') print(result) # 输出 ['123', '456'] ``` ##### 替换文本——sub() 利用指定的新字符串替换掉原字符串中的某些部分。 ```python new_text = re.sub(r'(\w+) (\w+)', r'\2 \1', "姓 名") print(new_text) # 输出 '名 姓' ``` ##### 判断是否完全匹配——fullmatch() 测试整个目标字符串能否被给定的模式完整地匹配上;成功时返回 Match 对象,失败则返回 None。 ```python if re.fullmatch(r'^\d{3}-\d{3}-\d{4}$', '123-456-7890'): print("电话号码格式正确") else: print("电话号码格式错误") ``` ##### 编译正则对象——compile() 当同一个正则表达式要反复使用时,建议将其编译为 RegexObject 实例来提高效率。 ```python pattern = re.compile(r'[a-z]+') matches = pattern.finditer('one two three four five six seven eight nine ten eleven twelve thirteen fourteen fifteen sixteen seventeen eighteen nineteen twenty') for match in matches: print(match.group()) ``` 以上就是关于 Python 正则表达式的简单入门指南[^2]。希望上述例子能帮助读者更好地理解和运用这一强大的工具来进行复杂的字符串操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值