python正则表达式

本文详细介绍正则表达式的常用元字符与限定符,并通过实例演示如何利用Python的re模块进行字符串匹配、替换及查找等操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则表达式

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

常用元字符

代码说明
.匹配除换行符以外的任意字符。 要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式
\w匹配字母或数字或下划线或汉字 == [A-Za-z0-9_]
\s匹配任意的空白符 == [\f\n\r\t\v]
\d匹配数字 == [0-9]
\b匹配单词的开始或结束
^匹配字符串的开始
$匹配字符串的结束

常用限定符

代码/语法说明
*重复零次或更多次
+重复一次或更多次
?重复零次或一次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次

一、正则表达式对象

re.RegexObject

re.compile() 返回 RegexObject 对象。用作 pattern

re.MatchObject

group() 返回被 RE 匹配的字符串。

  • start() 返回匹配开始的位置
  • end() 返回匹配结束的位置
  • span() 返回一个元组包含匹配 (开始,结束) 的位置

二、re匹配韩束

re.match(pattern, string, flags=0)

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 flags就是标志位,用于控制正则表达式的匹配方式。
如:不区分大小写,re.I 或者 re.IGNORECASE]
我们可以使用group 或者 groups方法得到字符串

注意:
group(num=0): 匹配的整个表达式的字符串
groups(): 返回一个包含所有小组字符串的元组

re.search(pattern, string, flags=0)

re.search 扫描整个字符串并返回第一个成功的匹配。

import re

match = re.search(re.compile("(\w+) wen (\w+)"), " zhao wen dao ")
print(match.group())
print(match.groups())
print(match.group(1))
print(match.group(1, 2))

# zhao wen dao
# ('zhao', 'dao')
# zhao
# ('zhao', 'dao')
re.sub(pattern, repl, string, count=0)

repl 是要替代的字符串

import re

phone = "2004-959-559 # 这是一个电话号码"
num = re.sub(r"#.*", "", phone)
print(num)

num = re.sub(r'\D', "", phone)
print(num)

# 2004-959-559 
# 2004959559
findall(pattern, string, flags=0)

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

string = "   zhao wen  dao  learn python "
p1 = re.compile("\w+\s+\w+")
print(p1.findall(string))
# ['zhao wen', 'dao  learn']

p1 = re.compile("(\w+)\s+\w+")
print(p1.findall(string))
# ['zhao', 'dao']

p1 = re.compile("((\w+)\s+\w+)")
print(p1.findall(string))
# [('zhao wen', 'zhao'), ('dao  learn', 'dao')]

可以发现,当findall 中pattern 有括号出现,返回的便是括号里的内容,而不是匹配的整个字符串,如果有多个括号,返回tuple 列表,tuple里的个数等于括号出现的个数,先后顺序按照括号出现的先后顺序。

re.split(pattern, string, maxsplit=0, flags=0])
import re

print(re.split('\W+', ' zwd, zhaowd!, hello  #.'))
# ['', 'zwd', 'zhaowd', 'hello', '']

print(re.split('(\W+)', ' zwd, zhaowd!, hello  #.'))
# ['', ' ', 'zwd', ', ', 'zhaowd', '!, ', 'hello', '  #.', '']
# 包括被用作split的字符串
内容概要:该研究通过在黑龙江省某示范村进行24小时实地测试,比较了燃煤炉具与自动/手动进料生物质炉具的污染物排放特征。结果显示,生物质炉具相比燃煤炉具显著降低了PM2.5、CO和SO2的排放(自动进料分别降低41.2%、54.3%、40.0%;手动进料降低35.3%、22.1%、20.0%),但NOx排放未降低甚至有所增加。研究还发现,经济性和便利性是影响生物质炉具推广的重要因素。该研究不仅提供了实际排放数据支持,还通过Python代码详细复现了排放特征比较、减排效果计算和结果可视化,进一步探讨了燃料性质、动态排放特征、碳平衡计算以及政策建议。 适合人群:从事环境科学研究的学者、政府环保部门工作人员、能源政策制定者、关注农村能源转型的社会人士。 使用场景及目标:①评估生物质炉具在农村地区的推广潜力;②为政策制定者提供科学依据,优化补贴政策;③帮助研究人员深入了解生物质炉具的排放特征和技术改进方向;④为企业研发更高效的生物质炉具提供参考。 其他说明:该研究通过大量数据分析和模拟,揭示了生物质炉具在实际应用中的优点和挑战,特别是NOx排放增加的问题。研究还提出了多项具体的技术改进方向和政策建议,如优化进料方式、提高热效率、建设本地颗粒厂等,为生物质炉具的广泛推广提供了可行路径。此外,研究还开发了一个智能政策建议生成系统,可以根据不同地区的特征定制化生成政策建议,为农村能源转型提供了有力支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值