初级爬虫(二)

本文深入探讨了正则表达式的应用,通过实例演示了如何使用Python的re模块进行字符串匹配、查找和替换等操作。从基本语法到高级用法,帮助读者掌握正则表达式的精髓。

正则专题一

import re
# re.findall(re,str)  基本语法
s1="total income is $750000,pretty good income"
a=re.findall("income",s1)
print(a)
a=re.findall("income$",s1)#从后匹配
print(a)
a=re.findall("$750000",s1)#$没有转义
print(a)
a=re.findall("\$750000",s1)#$有转义
print(a)
a=re.findall("[0-9]+",s1)
print(a)
a=re.findall("[^0-9]+",s1)#[]中的^是取非的意思,在[]外是从头开始匹配,不一样
print(a)

正则专题二

import re
# re.findall(re,str)  基本语法
url="https://www.baidu.com/asdioiqd/dacqefqe"
a=re.findall("https://(.+?)/",url)#只返回()中的内容
print(a)
a=re.sub("(?<=https://).*?(?=/)","xinglang",url)#字符串替换,只替换中间的.*?前后部分辅助限制
print(a)

转载于:https://blog.51cto.com/14156081/2360674

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值