re正则表达式

最新推荐文章于 2024-06-17 09:00:00 发布

wg5foc08

最新推荐文章于 2024-06-17 09:00:00 发布

阅读量160

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/wg5foc08/article/details/89034302

1.match()方法
向他传入要匹配的字符串及正则表达式，就可以检测正则表达式是否匹配字符串，
它从字符串的起始位置开始匹配字符串，
如果匹配，就返回匹配成功的结果。
2.匹配目标
想从文本中提取一部分内容可以使用()将想要提取的字符串括起来，
()标记了一个字表达式开始和结束的位置，
被标记的每个子表达式会依次对应每一个分组，调用group方法
传入分组的索引即可获取提取的结果，
import re
content = ‘Hello 1234566 World_this is a regex demo’
result = re.match(‘Hello\s(\d+)\sWorld’,content)
print(result)
print(result.group())
print(result.group(1))
print(result.span())
将字符串中的数字提取出来，可将数字部分的正则表达式用()括起来，
后调用group(1)获取匹配结果
3.通用匹配"."
"."代表可以匹配任意字符（除了换行符），
“”代表匹配前面的字符无限次，
"."组合在一起可以匹配任意字符
4.贪婪和非贪婪
"."组合在一起可以匹配任意字符，它是贪婪匹配，即匹配竟可能多的字符，
".*?"非贪婪匹配，即尽可能匹配少的字符。
5.修饰符
修饰符是可选的它可以用来控制匹配的模式。
re.I    使匹配对大小写不敏感
re.L   做本地化识别（local-aware）匹配
re.M 多行匹配，影响^和$
re.S   使.匹配包括在内的所有字符
re.U 根据Unicode字符集解析字符，这个标志影响\w,\W,\b和\B
re.X   可以使正则表达式写得更易于理解
在网页匹配中，常用re.S和re.I
6.search()方法
使用match()方法是在待匹配的字符串开头开始匹配，如果开头不匹配就会则匹配失败，
使用search()方法在匹配时会扫描整个字符串，
后返回第一个成功匹配的的结果。
7.findall()方法
search()方法可以返回匹配正则表达式的第一个内容，如果想获取匹配正则表达式的所有内容可以使用findall()方法
8.sub()方法
sub()方法可以修改文本
9.compile()方法
compile方法是用来处理字符串的方法，该方法将正则字符串编译成正则表达式对象，以便复用