re.match(pat, string, flags=0) #匹配成功re.match方法返回一个匹配的对象,否则返回None。
* pat 匹配的正则表达式
* string 要匹配的字符串。
* flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等
######
######
###### re.search函数
re.search 扫描整个字符串并返回第一个成功的匹配。
函数语法:
re.search(pattern, string, flags=0) #匹配成功re.search方法返回一个匹配的对象,否则返回None。
* pat 匹配的正则表达式
* string 要匹配的字符串。
* flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等
###### re.search函数和re.match函数的区别
相信大家已经想到了 re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
###### 实例:
import re
line = “Cats are smarter than dogs”;
matchObj = re.match(r’dogs’, line) #不在其实位置匹配
if matchObj:
print ("match --> : ", matchObj.group())
else:
print(“match没有匹配到”)
matchObj = re.search(r’dogs’, line) #不在其实位置匹配
if matchObj:
print("search --> : ", matchObj.group())
else:
print( “search没有匹配到”)
运行结果为:
match没有匹配到
search --> : dogs
###### 获取匹配对象方法:
我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配对象内容。
* group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
* groups() 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
实例:
import re
line = “Cats are smarter than dogs”
matchObj = re.match(r’(.) are (.?) .*', line)
if matchObj:
print( "matchObj.group() : ", matchObj.group())
print("matchObj.group(1) : ", matchObj.group(1))
print("matchObj.group(2) : ", matchObj.group(2))
print("matchObj.groups() : ",matchObj.groups()) #返回一个元祖
else:
print( “No match!!”)
运行结果为:
matchObj.group() : Cats are smarter than dogs
matchObj.group(1) : Cats
matchObj.group(2) : smarter
matchObj.groups() 😦‘Cats’, ‘smarter’)
###### re.compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
语法格式为:
re.compile(pattern[, flags]) #定义正则规则
参数:
* pattern : 一个字符串形式的正则表达式
* flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
1. re.I 忽略大小写
2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
3. re.M 多行模式
4. re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
6. re.X 为了增加可读性,忽略空格和 # 后面的注释
实例:
import re
pattern = re.compile(r’\d+') # 用于匹配至少一个数字
m = pattern.match(‘one12twothree34four’, 3, 10) # 从’1’的位置开始匹配,正好匹配
print(m) # 返回一个 Match 对象
print(m.group()) #通过group获取匹配内容
运行结果为:
<_sre.SRE_Match object; span=(3, 5), match=‘12’>
12
####
###### findall
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
\*\*\*match 和 search 是匹配一次 findall 匹配所有。
语法格式为:
findall(string[, pos[, endpos]])
参数:
* string : 待匹配的字符串。
* pos : 可选参数,指定字符串的起始位置,默认为 0。
* endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。
实例:
import re
pattern = re.compile(r’\d+') # 查找数字
result1 = pattern.findall(‘sffss 123 google 456’)
result2 = pattern.findall(‘dsa88dfg123google456’, 0, 10)
print(result1)
print(result2)
运行结果为:
[‘123’, ‘456’]
[‘88’, ‘12’]
####
###
####
###### 检索和替换
####
Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。
语法:
re.sub(pattern, repl, string, count=0, flags=0)
参数:
* pattern : 正则中的模式字符串。
* repl : 替换的字符串,也可为一个函数。
* string : 要被查找替换的原始字符串。
* count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
实例:
####
import re
将匹配的数字乘以 2
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。
别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。
我先来介绍一下这些东西怎么用,文末抱走。
(1)Python所有方向的学习路线(新版)
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python学习视频
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
(4)200多本电子书
这些年我也收藏了很多电子书,大概200多本,有时候带实体书不方便的话,我就会去打开电子书看看,书籍可不一定比视频教程差,尤其是权威的技术书籍。
基本上主流的和经典的都有,这里我就不放图了,版权问题,个人看看是没有问题的。
(5)Python知识点汇总
知识点汇总有点像学习路线,但与学习路线不同的点就在于,知识点汇总更为细致,里面包含了对具体知识点的简单说明,而我们的学习路线则更为抽象和简单,只是为了方便大家只是某个领域你应该学习哪些技术栈。
(6)其他资料
还有其他的一些东西,比如说我自己出的Python入门图文类教程,没有电脑的时候用手机也可以学习知识,学会了理论之后再去敲代码实践验证,还有Python中文版的库资料、MySQL和HTML标签大全等等,这些都是可以送给粉丝们的东西。
这些都不是什么非常值钱的东西,但对于没有资源或者资源不是很好的学习者来说确实很不错,你要是用得到的话都可以直接抱走,关注过我的人都知道,这些都是可以拿到的。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!