爬虫 之 re库

本文介绍了正则表达式的基本使用方法,包括match、search、findall、sub和compile等函数的应用场景和语法。通过实例讲解了如何进行字符串匹配、搜索、替换及规则复用,适合初学者快速上手。

A表示正则的规则,B表示字符串

 

match()

 从开头开始匹配,若开头就匹配失败,则返回为None

result = re.match('~~A~~','~~B~~')

result.group() 

 

若A:的规则中有用 小括号() 圈起来东西,可以按顺序由 result.group(1)    result.group(2)  .......等匹配得到

 

search()

扫描整个字符串,返回第一个成功匹配正则表达式的内容

result = re.search('~~A~~','~~B~~')
result.group() 

 

findall()

扫描整个字符串,返回所有匹配正则表达式的内容(返回值是元组组成的列表)

results = re.findall(‘~~A~~’,'~~B~~')

for result in results:
    print(result)

 

sub()

替换正则表达式匹配中的内容

result = re.sub('~~A~~','','~~B~~')
print(result)

把匹配的内容删去

 

compile()

复用正则表达式的规则

pattern = re.compile('~~A~~')

result1 = re.search(pattern, '~~B~~')
result2 = re.search(pattern, '~~C~~') # C 为另一组文本

 

 

ok

 

88

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值