Python之正则表达式

本文介绍了正则表达式,它是一套可在字符串文本中进行搜查替换等操作的规则。文中给出多个Python使用正则表达式的案例,涵盖re基本使用流程、match等常用方法,还提及匹配中文、贪婪与非贪婪模式,并给出相关教程链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

w3cschool教程:https://www.w3cschool.cn/zhengzebiaodashi/regexp-tutorial.html

新w3cschool教程:http://www.hechaku.com/p/zhengze/

菜鸟教程:http://www.runoob.com/python/python-reg-expressions.html

正则表达式

  • 一套规则,可以在字符串文本中进行搜查替换等
  • 案例1,re的基本使用流程
  • 案例2,match的基本使用
  • 正则常用方法:
    • match: 从开始位置开始查找,一次匹配,找到一个就结束
    • search:从任何位置查找,一次匹配, 案例3
    • findall: 全部匹配,返回列表, 案例4
    • finditer: 全部匹配,返回迭代器, 案例4
    • split: 分割字符串,返回列表
    • sub:替换
  • 匹配中文
    • 中文unicode范围主要在[u4e00-u9fa5]
    • 案例5
  • 贪婪与非贪婪模式
    • 贪婪模式: 在整个表达式匹配成功的前提下,尽可能多的匹配
    • 非贪婪模式: xxxxxxxxxxxxxxxxxxxxxx, 尽可能少的匹配
    • python里面数量词默认是贪婪模式
    • 例如:
      • 查找文本abbbbbbccc
      • re是 ab*
      • 贪婪模式: 结果是abbbbbb
      • 非贪婪: 结果是a 

案例1: 

'''
python中正则模块是re
使用大致步骤:
1. compile函数讲正则表达式的字符串便以为一个Pattern对象
2. 通过Pattern对象的一些列方法对文本进行匹配,匹配结果是一个Match对象
3. 用Match对象的方法,对结果进行操纵
'''
import re

# \d表示以数字
# 后面+号表示这个数字可以出现一次或者多次
s = r"\d+" # r表示后面是原生字符串,后面不需要转义

# 返回Pattern对象
pattern = re.compile(s)

# 返回一个Match对象
# 默认找到一个匹配就返回
m = pattern.match("one12two2three3")

print(type(m))
# 默认匹配从头部开始,所以此次结果为None
print(m)

# 返回一个Match对象
# 后面为位置参数含义是从哪个位置开始查找,找到哪个位置结束
m = pattern.match("one12two2three3", 3, 10)

print(type(m))
# 默认匹配从头部开始,所以此次结果为None
print(m)

print(m.group())

print(m.start(0))
print(m.end(0))
print(m.span(0))

案例2: 

'''
正则结果Match的使用案例
'''

import re

# 以下正则分成了两个组,以小括号为单位
s = r'([a-z]+) ([a-z]+)'
pattern = re.compile(s, re.I) # s.I表示忽略大小写

m = pattern.match("Hello world wide web")

# goup(0)表示返回匹配成功的整个子串
s = m.group(0)
print(s)

a = m.span(0) # 返回匹配成功的 整个子串的跨度
print(a)

# gourp(1)表示返回的第一个分组匹配成功的子串
s = m.group(1)
print(s)

a = m.span(1) # 返回匹配成功的第一个子串的跨度
print(a)

s = m.groups() #等价于m.gourp(1), m.group(2).......
print(s)

案例3: 

'''
search
'''
import re

s = r'\d+'

pattern = re.compile(s)

m = pattern.search("one12two34three56")
print(m.group())

# 参数表明搜查的起始范围,结束为止可以大于串的长度
m = pattern.search("one12two34three56", 10, 40)
print(m.group())

案例4: 

'''
findall案例
'''
import re

pattern = re.compile(r'\d+')

s = pattern.findall("i am 18 years odl and 185 high")

print(s)

s = pattern.finditer("i am 18 years odl and 185 high")

print(type(s))

for i in s:
    print(i.group())

案例5: 

'''
中文unicode案例
'''

import re

hello = u'你好,世界'

pattern = re.compile(r'[\u4e00-\u9fa5]+')

m = pattern.findall(hello)
print(m)

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ydw_ydw

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值