
数据解析
弹吉他的羊驼
这个作者很懒,什么都没留下…
展开
-
python爬虫之xpath案例——爬取某网站上所有的免费ppt模板
需求:爬取站长网站上某一页的所有的ppt的压缩包url :https://sc.chinaz.com/ppt/free.html代码奉上!!! 希望可以有用!# 需求:爬取站长素材中的免费ppt模板# url = 'https://sc.chinaz.com/ppt/free.html'import requestsfrom lxml import etreeimport os#用来创建一个文件夹if not os.path.exists('./rarlibs'): os.mkdi原创 2021-04-03 21:17:47 · 716 阅读 · 0 评论 -
python爬虫之xpath案例——全国城市名称爬取
# 需求:解析出所有城市名称# url : https://www.aqistudy.cn/historydata/import requestsfrom lxml import etree# # 分别爬取热门城市和全部城市的信息: 即需要两个循环# headers = {# 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.原创 2021-04-03 20:11:00 · 1218 阅读 · 1 评论 -
python爬虫之xpath案例——爬取58同城二手房数据
#需求:爬取58二手房中的房源信息import requestsfrom lxml import etree# 爬取到页面源码数据headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.63'}url = 'https://cn.58.原创 2021-04-03 19:44:08 · 3553 阅读 · 4 评论 -
python数据解析之xpath
xpath解析:最常用且最便捷高效的一种解析方式,通用性强。xpath解析原理:1.实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中2.调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的提取。xpath的安装:pip install lxmllxml是一种解析器。如何实例化一个etree对象:from lxml import etree1.将本地的html文档中的源码数据加载到etree对象中: etree.parse(fi原创 2021-04-02 21:02:20 · 267 阅读 · 1 评论