关于使用正则表达式解析网页内容

关于使用正则表达式解析网页内容

正则表达式用于对字符串进行操作,事先定义好特定的规则,利用这个规则对字符串进行过滤。对网页内容解析时,可以将源代码变为字符串,利用正则表达式进行匹配。

常见的正则字符和含义

模式 描述 模式 描述
. 匹配任意字符,除了换行符 \s 匹配空白字符串
* 匹配前一个字符0次或多次 \S 匹配任何非空白字符串
+ 匹配前一个字符1次或多次 \d 匹配数字,等价于 [0-9]
? 匹配前一个字符0次或1次 \D 匹配任何非数字,等价于 [^0-9]
^ 匹配字符串开头
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值