Python使用xpath对解析内容进行数据提取

最新推荐文章于 2025-06-30 21:49:14 发布

做梦都在改BUG

最新推荐文章于 2025-06-30 21:49:14 发布

阅读量932

点赞数 17

CC 4.0 BY-SA版权

文章标签： python 开发语言

在前面的文章当中，已经教大家如何去获取我们需要的数据原文内容，今天就介绍一个用于提取所需数据的方法之一xpath。在后续会讲解bs4(beautifulsoup),re正则表达式。

XPath 使用路径表达式来选取HTML/ XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

使用到python中的一个lxml库：下载 pip install lxml

表达式	描述
nodename	选取此节点的所有子节点。
/	从根节点选取（取子节点）。
//	从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置（取子孙节点）。
.	选取当前节点。
..	选取当前节点的父节点。
@	选取属性。