超哥带你玩转正则表达式-连载（七）

橙好测试开发

于 2021-06-24 23:21:38 发布

阅读量645

点赞数

分类专栏： python 文章标签：正则表达式 python 字符串列表

本文链接：https://blog.youkuaiyun.com/rainshine1190/article/details/118198397

版权

python 专栏收录该内容

19 篇文章

订阅专栏

(一)一句话弄明白你的疑问

(二)正则表达式啥玩意？

(三)正则表达式的语法（第一招）

1.元字符

2. 重复限定符

3. 分组

4. 转义

5. 条件或

6. 区间

(四)练练手

(五)正则表达式的函数（第二招）

1.re.compile函数

2.re.findall函数（最常用）

3.re.sub函数（中等）

4.re.search函数（一般）

5.re.match函数（很少）

6.re.match与re.search的区别

7.re.finditer（很少）

8.re.split（很少）

(六)正则表达式语法速查表

书接上回，咱们上次讲了前面的几个常用函数，今天继续讲解剩下的函数，开始表演

8.re.split（很少）

split 方法按照能够匹配的子串将字符串分割后返回列表，它的使用形式如下：

re.split(pattern,string[, maxsplit=0, flags=0])

函数参数说明：

· pattern : 匹配的正则表达式

· string : 待匹配的字符串。

· flags: 同上一个函数介绍

实例

import re 
line = 'aaa bbb ccc;ddd eee,fff'
#[]表示区间可选，\s表示空表字符，比如空格，
result = re.split(r"[\s,;]",line) 
print('result结果：',result)

代码输出：

result结果：['aaa', 'bbb', 'ccc', 'ddd', '', '', 'eee', 'fff']

总结：讲到这里，正则的两个法宝咱们已经收入囊中，接下来就是每日苦练，达到熟练运用，炉火纯青的地步，正则的确能在很多时候帮我们解决很多问题，不管是工具开发还是框架设计，他都起着举足轻重的作用，想要学好正则，还需要大家不停的练习和使用才能领悟其中的技巧。

语法速查表

模式	描述
^	匹配字符串的开头，比如：^\d，表示：开头是数字。
$	匹配字符串的末尾。比如：\d$，表示：结尾是数字。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[...]	用来表示一组字符,单独列出：[amk] 匹配 'a'，'m'或'k'
[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。
re*	匹配0个或多个的表达式，re代表你的正则表达式。
re+	匹配1个或多个的表达式，re代表你的正则表达式。
re?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re{ n}	精确匹配 n 个前面表达式。例如， o{2} 不能匹配 "Bob" 中的 "o"，但是能匹配 "food" 中的两个 o。
re{ n,}	匹配 n 个前面表达式。例如， o{2,} 不能匹配"Bob"中的"o"，但能匹配 "foooood"中的所有 o。"o{1,}" 等价于 "o+"。"o{0,}" 则等价于 "o*"。
re{ n, m}	匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a\| b	匹配a或b
(re)	对正则表达式分组并记住匹配的文本，可以用他来获取指定的匹配字符
\w	匹配字母数字及下划线
\W	匹配非字母数字及下划线
\s	匹配任意空白字符，等价于 [ \t\n\r\f]。
\S	匹配任意非空字符
\d	匹配任意数字，等价于 [0-9].
\D	匹配任意非数字
\A	匹配字符串开始
\Z	匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串。
\z	匹配字符串结束
\G	匹配最后匹配完成的位置。
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
\B	匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
\n, \t, 等.	匹配一个换行符。匹配一个制表符。等
\1...\9	匹配第n个分组的内容。
\10	匹配第n个分组的内容，如果它经匹配。否则指的是八进制字符码的表达式。