目录
为什么要学习xpath和lxml
lxml是一款高性能的 Python HTML/XML 解析器,我们可以利用XPath(解析的语言),来快速的定位特定元素以及获取节点信息
lxml库需要安装
- 安装语句: 在cmd命令行中输入:pip install lxml
- 如果安装lxml库出错,建议自行百度查找方法
什么是xpath
XPath (XML Path Language) 是一门在 HTML\XML 文档中查找信息的语言,可用来在 HTML\XML 文档中对元素和属性进行遍历。
W3School官方文档:http://www.w3school.com.cn/xpath/index.asp
可以使用的在path中节点选择的工具
- Chrome插件 XPath Helper
(安装方法见以载入Chrome插件 XPath Helper为例普及谷歌Google Chrome浏览器导入扩展包(crx文件)方法和错误解决) - Firefox插件 XPath Checker