python正则表达式心得

本文详细介绍了正则表达式的各种元字符和操作符,如`.`、`*`、`+`、`?`、花括号以及方括号的用法。通过实例展示了如何匹配、分割和替换字符串。此外,还讲解了正则表达式在字符串替换和切割中的应用,例如使用`re.split()`和`re.sub()`函数。文章深入浅出,适合对正则表达式感兴趣的读者学习。

. 表示要匹配除了换行符之外的任何 单个 字符。 例子: content = '''苹果是绿色的 橙子是橙色的 香蕉是黄色的 乌鸦是黑色的'''

import re p = re.compile(r'.色') for one in p.findall(content): print(one)

*-重复匹配任意次 例子: content = '''苹果,是绿色的 橙子,是橙色的 香蕉,是黄色的 乌鸦,是黑色的 猴子,'''

import re p = re.compile(r',.*') for one in p.findall(content): print(one)

+表示匹配前面的子表达式一次或多次,不包括0次 ? 表示匹配前面的子表达式0次或1次。 花括号-匹配指定次数 例子: 在字符串s='abcaabaaa'中 a{2,3}标识匹配2到3次,会匹配到aa和aaa

.和.?的区别在于贪婪和非贪婪 例子在s='<abc>,<bcd>,<qwe>'中 <.>会匹配到所有内容,<.?>贼会匹配到<abc>、<bcd>、<qwe>三个分开的内容

\是对字符的转义。要匹配.前面的字符应写成.*.对第二个.转义

\d 匹配0-9之间任意一个数字字符,等价于表达式 [0-9]

\D 匹配任意一个不是0-9之间的数字字符,等价于表达式 [^0-9]

\s 匹配任意一个空白字符,包括 空格、tab、换行符等,等价于表达式 [\t\n\r\f\v]

\S 匹配任意一个非空白字符,等价于表达式 [^ \t\n\r\f\v]

\w 匹配任意一个文字字符,包括大小写字母、数字、下划线,等价于表达式 [a-zA-Z0-9_] 缺省情况也包括 Unicode文字字符,如果指定 ASCII 码标记,则只包括ASCII字母

\W 匹配任意一个非文字字符,等价于表达式 [^a-zA-Z0-9_]

反斜杠也可以用在方括号里面,比如 [\s,.] 表示匹配 : 任何空白字符, 或者逗号,或者点

方括号表示要匹配 指定的几个字符之一 。 [abc] 可以匹配 a, b, 或者 c 里面的任意一个字符。等价于 [a-c]

一些 元字符 在 方括号内 失去了魔法, 变得和普通字符一样了。 比如 [akm.] 匹配 a k m . 里面任意一个字符 这里 . 在括号里面不在表示 匹配任意字符了,而就是表示匹配 . 这个 字符

如果在方括号中使用 ^ , 表示 非 方括号里面的字符集合。 ^ 表示匹配文本的 开头 位置。 $ 表示匹配文本的 结尾 位置。 如果是 单行模式 ,表示匹配 整个文本 的开头(结尾)位置。 如果是 多行模式 ,表示匹配 文本每行 的开头(结尾)位置。 注意,compile 的第二个参数 re.M ,指明了使用多行模式, p = re.compile(r'^\d+', re.M)

竖线表示 匹配 前者 或 后者

正则表达式切割 例子

import re

names = '关羽; 张飞, 赵云, 马超, 黄忠 李逵'

namelist = re.split(r'[;,\s]\s*', names) print(namelist)

正则表达式 [;,\s]\s* 指定了,分割符为 分号、逗号、空格 里面的任意一种均可,并且 该符号周围可以有不定数量的空格。

字符串的替换newStr = re.sub(r'/av\d.+?/', '/cn345677/' , names)

如果以某些字符为特征却不想要这些字符可以采用分组 例子: content = '''苹果,苹果是绿色的 橙子,橙子是橙色的 香蕉,香蕉是黄色的'''

import re p = re.compile(r'^(.*),', re.MULTILINE) for one in p.findall(content): print(one)

就是不要,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值