python正则表达式 re模块的使用

本文深入探讨了正则表达式的各种元字符及其用法,包括匹配、搜索、子组、贪婪与非贪婪匹配等概念,并通过实例展示了如何使用Python的re模块进行字符串的匹配、查找、替换和分割。
部署运行你感兴趣的模型镜像

在这里插入图片描述
正则表达式的元字符 摘自百度百科

import re

加载python的正则表达式模块re

print re.match("app", "app123").group()         #app
#print re.match("app", "123app").group()        #Err 从头匹配失败则终止
print re.search("app", "123app").group()        #app

match和search的区别 match从头匹配一旦匹配失败则结束 search整体匹配返回第一个匹配成功

r = "bat|bet|bit"
print re.match(r, "bat").group()                #bat
print re.match(r, "bit").group()                #bit
#print re.match(r, "He bit me!").group()        #Err 从头匹配失败则终止
print re.search(r, "He bit me!").group()        #bit

|符号 同时匹配多个

r = ".end"
print re.match(r, "bend").group()               #bend
#print re.match(r, "bbend").group()             #Err 只能匹配一个字符
#print re.match(r, "end").group()               #Err 少了也不行
#print re.match(r, "\nend").group()             #Err 不能匹配换行或空字符串
print re.search(r, "theend").group()            #eend 返回的是匹配到的部分

.符号 匹配任意单个字符 想匹配普通的点加转移符.

r = "[cr][23][dp][o2]"
print re.match(r, "c3po").group()               #c3po
print re.match(r, "c2do").group()               #c2do
#print re.match(r, "c5do").group()              #Err 5没有匹配到

[]符号 创建字符集合

r = "\w\w\w-\d\d\d"                             #\w匹配任意字母数字 \d匹配任意数字
r2 = "(\w\w\w)-(\d\d\d)"
print re.match(r, "abc-123").group()            #abc-123
#print re.match(r, "abc-123").group(1)          #Err 没有子组
#print re.match(r, "abc-123").group(2)          #Err 
print re.match(r, "abc-123").groups()           #()
print re.match(r2, "abc-123").group()           #abc-123
print re.match(r2, "abc-123").group(1)          #abc 返回对应子组
print re.match(r2, "abc-123").group(2)          #123
print re.match(r2, "abc-123").groups()          #('abc', '123') 以元组形式返回所有子组

使用括号()创建子组

r = "^the"
print re.search(r, "the end").group()           #the
#print re.search(r, "this is the end").group()  #Err ^限制了只能在开头匹配

^符号 表示从开头匹配

r = r"\bthe"                                    #前面加r表示不做转义处理
print re.search(r, "the end").group()           #the
print re.search(r, "this is the end").group()   #the
#print re.search(r, "this isthe end").group()   #Err the和前面的连在一起了 不是单词边界
print re.search(r"\Bthe", "this isthe end").group() #\B表示反义

\b 表示一个单词的边界

r = 'href="(.*?)"'
str = """
<li><a href="https://www.baidu.com/">百度</a><//li>
<li><a href="https://www.sogou.com/">搜狗</a><//li>
<li><a href="https://www.so.com/">360搜索</a><//li>
"""
print re.findall(r, str) #['https://www.baidu.com/', 'https://www.sogou.com/', 'https://www.so.com/']

findall函数的使用 整体匹配 以列表方式返回所有匹配的子组(括号部分)

print re.sub("BOY|GIRL", "HUMAN", "BOY and GIRL") #HUMAN and HUMAN

sub函数 实现正则表达式匹配替换


str = "2018/11/23  00:59                16 input.txt" #dir输出中的一行 按空格分割字符但是将文件大小和文件名放一起
print re.split("\s\s+", str)                    #\s\s+表示至少有一个空格

split函数 实现字符串的分割

#print re.match("\bblow", "blow").group()       #Err \b在ascii中表示退格 冲突
print re.match("\\bblow", "blow").group()       #blow 多加一个\
print re.match(r"\bblow", "blow").group()       #前增加r表示不尽兴转义

正则表达式ascii码冲突解决

r = "x{2,3}"
#print re.match(r, "x").group()                 #Err 
print re.match(r, "xx").group()                 #xx
print re.match(r, "xxx").group()                #xxx 优先匹配长的
print re.match(r, "xxxx").group()               #xxx
#print re.match(r, " xxxx").group()             #Err

{}符号 指定出现次数

print re.match("a.*b", "aabab").group()         #aabab 贪婪匹配 尽可能的长
print re.match("a.*?b", "aabab").group()        #aab 非贪婪匹配 尽可能的短
print re.search("a.*?b", "aabab").group()       #aab而不是ab 返回第一个最短的匹配
print re.match(".*(\d+-\d+-\d+)", str).group(1) #9-6-10 +符号默认贪婪 导致数字匹配到加号
print re.match(".*?(\d+-\d+-\d+)", str).group(1)#1458002539-6-10

贪婪匹配和非贪婪匹配

re.search(regex, str, re.S) #.的作用效果扩展到所有字符包括换行
re.search(regex, str, re.I) #忽略大小写
re.search(regex, str, re.S | re.I) #多标志位

标志位

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

先看效果: https://renmaiwang.cn/s/jkhfz Hue系列产品将具备高度的个性化定制能力,并且借助内置红、蓝、绿三原色LED的灯泡,能够混合生成1600万种不同色彩的灯光。 整个操作流程完全由安装于iPhone上的应用程序进行管理。 这一创新举措为智能照明控制领域带来了新的启示,国内相关领域的从业者也积极投身于相关研究。 鉴于Hue产品采用WiFi无线连接方式,而国内WiFi网络尚未全面覆盖,本研究选择应用更为普及的蓝牙技术,通过手机蓝牙与单片机进行数据交互,进而产生可调节占空比的PWM信号,以此来控制LED驱动电路,实现LED的调光功能以及DIY调色方案。 本文重点阐述了一种基于手机蓝牙通信的LED灯设计方案,该方案受到飞利浦Hue智能灯泡的启发,但考虑到国内WiFi网络的覆盖限制,故而选用更为通用的蓝牙技术。 以下为相关技术细节的详尽介绍:1. **智能照明控制系统**:智能照明控制系统允许用户借助手机应用程序实现远程控制照明设备,提供个性化的调光及色彩调整功能。 飞利浦Hue作为行业领先者,通过红、蓝、绿三原色LED的混合,能够呈现1600万种颜色,实现了全面的定制化体验。 2. **蓝牙通信技术**:蓝牙技术是一种低成本、短距离的无线传输方案,工作于2.4GHz ISM频段,具备即插即用和强抗干扰能力。 蓝牙协议栈由硬件层和软件层构成,提供通用访问Profile、服务发现应用Profile以及串口Profiles等丰富功能,确保不同设备间的良好互操作性。 3. **脉冲宽度调制调光**:脉冲宽度调制(PWM)是一种高效能的调光方式,通过调节脉冲宽度来控制LED的亮度。 当PWM频率超过200Hz时,人眼无法察觉明显的闪烁现象。 占空比指的...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值