前言
简单的Python练习,对页面中的某些部分的文字进行爬取
介绍

xpath解析: 最常用且最便捷高效的一种解析方式。通用型。
-xpath解析原理:
- 1. 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中。
- 1. 调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获。
环境的安装:
- pip install lxml
-如何实例化一个entree对象:from lxml import etree
- 1. 将本地的html文档中的源码数据加载到etree对象中:
etree.parse(filePath)
- 2. 可以将从互联网上获取的源码数据加载到该对象中
etree.HTML('page_text')
-xpath('xpath表达式')
-xpath表达式:
- /:表示的是从一个根节点开始定位,表示一个层级。
- //:表示的是多个层级,可以从任意位置开始定位。
- 属性定位://div[@class

本文是一篇关于使用Python爬虫通过XPath解析技术抓取58同城二手房详情页面内容的实践教程,旨在提升Python爬虫技能。文章包含爬虫代码展示及运行结果截图。
最低0.47元/天 解锁文章
2160

被折叠的 条评论
为什么被折叠?



