python中的re模块的不匹配 \n 符

本文探讨了在处理HTML文档时如何利用正则表达式进行元素抓取,特别是针对图片源链接的匹配技巧。通过具体示例,文章详细解释了如何编写正则表达式来准确匹配目标信息,同时避免匹配到特殊字符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在re中,如果使用 

reg = re.compile(r'''<i class="board-index.+?">(.+?)</i>''') 
a = reg.findall(html, re.S)

之类时,"."时不会匹配 \n 之类的特殊符号的,要想匹配的特殊符号,

要写成

reg_img = re.findall(r'''<img data-src="(.+?)" alt=''',html,re.S)
如上,在一起的格式
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值