python中的正则表达式(模式匹配)

本文介绍了Python中re模块的基本使用方法,包括常用的正则表达式符号和匹配规则,并通过具体示例展示了如何进行字符串匹配、查找及拆分。此外还介绍了如何利用Python的帮助系统获取模块的详细文档。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python中提供了re模块,可以用来进行模式匹配,通过import re help(re)的方式可以十分详细的说明文档。

关于匹配规则
python中匹配规则和perl、matlab等类似,如比较基础的:
. : 匹配除了换行符之外的任意的字符
^ : 匹配字符串的开头
$ : 匹配字符串的末尾
* + ?: 对应匹配规则的重复次数
\d:匹配数字
\D : 匹配非数字字母
\w : 匹配字母,包括数字字符
\s、\S...
\同样可以作为转义字符使用,当匹配多个斜杠时,需要使用的方式\\\* 而非\\*;

re模块方法的使用
调用方式: re.func(pattern,string...)
其中: pattern是需要满足的规则表达式,string是需要模式匹配的字符串...
re模块提供的接口:
match : 用规则表达式匹配字符串的开头
search : 找到字符串中满足规则表达式的地方
findall : 从字符串中找到所有满足规则表达式的字串
split : 从满足规则表达式的地方对字符串进行拆分
... ...

实例说明
aa.txt的文件内容: aaa cc\\cc dddd 55555
test.py
#!/usr/bin/python
import os
import re

fileHandle = open('aa.txt','r')
for line in fileHandle.readlines():
    matchStr = '\w+\\\*\w*'
    #matchStr = '\D+'
    line = line.strip()
    if(line):
        rslt = re.findall(matchStr,line)
        for rsltelement in rslt:
            print('%s'%rsltelement)

fileHandle.close()

使用:matchStr = '\D+'时:输出:
  aaa cc\cc dddd  55555  
import os
import re

使用matchStr = '\w+\\\*\w*'时,输出:
aaa
cc\cc
dddd
55555

关于python的帮助
python中的帮助特别好用:
查看系统模块帮助方法:
第一步:import modulename
第二步:help(modulename)就能很好看到模块的各项说明及其可以使用的方法说明;dir(modulename)能看到各个方法的函数名。(help(modulename.funcname)同样可以使用)

当然自定义模块也可以达到同样效果:
只需要在文档、类、函数名等下面加上相应方式的解释说明,使用方式(使用三个单引号):'''说明文字'''。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值