
正则表达式
心之凌儿
写代码是专业的
展开
-
python爬虫的几种数据解析提取方式
使用python爬虫,无论是requests库还是urllib库爬取网页源代码后,想要直接获取其中的信息是比较难的,通常要借助一些第三方库来进行解析并信息提取,目前简单快捷的有bs4库、正则表达式和xpath来完成,下面通过一个实例来解释他们具体的使用方式: import requests from bs4 import BeautifulSoup import json import re from lxml import etree from urllib.parse import quote head原创 2020-08-10 08:06:14 · 682 阅读 · 0 评论 -
关于正则表达式的转义问题
今天python爬虫使用正则表达式匹配字符死活匹配不到结果 import re list="hello\/world" str=re.findall("hello\/wrold",list) print(str) 输出为空: [] 以上为例子,可以看出可能是有转义问题,"\"是转义字符的标配,应该是出了一些问题,尝试一下反转义 str=re.findall(r"hello\/wrold",li...原创 2019-11-14 16:36:30 · 311 阅读 · 0 评论