正则表达式

最新推荐文章于 2022-03-25 18:09:23 发布

月虹

最新推荐文章于 2022-03-25 18:09:23 发布

阅读量117

点赞数

CC 4.0 BY-SA版权

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43976393/article/details/88935792

python 专栏收录该内容

11 篇文章

订阅专栏

正则表达式:正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

在线测试http://tool.chinaz.com/regex/

1.元字符

量词	匹配内容
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线
\s	匹配任意的空白符
\d	匹配数字
\n	匹配一个换行符
\t	匹配一个制表符
\b	匹配一个单词的结尾
^	匹配字符串的开始
$	匹配字符串的结尾
\W	匹配非字母或数字或下划线
\D	匹配非数字
\S	匹配非空白符
a\|b	匹配字符a或字符b
()	匹配括号内的表达式，也表示一个组
[...]	匹配字符组中的字符
[^...]	匹配除了字符组中字符的所有字符

2.量词

量词	用法说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

3.惰性匹配和贪婪匹配

贪婪匹配:尽可能多的匹配到结果. ` * `, `+`, `{}`都是贪婪匹配

惰性匹配:尽可能少的匹配 . `?`是惰性匹配

正则	待匹配字符	匹配结果	说明
a.	abcdefgac	ab ac	只匹配a和a后面一个字符
a+	abcdefgac	a a	a出现一次或多次
a.*	abcdefgac	abcdefgac	贪婪匹配 a后面的都能匹配
a.?	abcdefgac	空	惰性匹配,"a."
^a.	abcdefgac	ab	只从开头匹配"a."
a.$	abcdefgac	ac	只匹配结尾的"a.$" 以acc结尾就无法匹配

4.分组

正则中用()进行分组,()的优先级最高

\1获取第一个分组内的内容,(数小括号)

5.转义

如果要在正则中匹配正常的"\n"⽽不是"换⾏符"就需要对"\"进⾏转义, 变成'\\'.在python中, ⽆论是正则表达式, 还

是待匹配的内容, 都是以字符串的形式出现的, 在字符串中\也有特殊的含义, 本身还需要转义. 所以如果匹配⼀次"\n", 字符串中要写成'\\n', 那么正则⾥就要写成"\\\\n",这样就太麻烦了.

此时的正则是r'\\n'就可以做到(在前面加r表示字符串不进行转义,按照原样匹配,一个r解决所有.....)

6.字符组

用[ ]括起来,在[ ]内的内容会被匹配

例如[abc] 匹配a或b或c

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。