目录
摘要:
from lxml import html :使用html类
html.fromstring():文本转换html
html.xpath():提取信息
//:匹配元素,匹配条件写双斜杠后面
@:选取元素属性
一、安装XPath
控制台输入指令:pip install lxml
二、XPath的基础语法
XPath是一种在XML文档中查找信息的语言,可以使用它在HTML源代码文档中通过元素、属性等方式进行查找和提取数据。
1.选取节点
表达式 | 描述 |
nodename | 选取此元素的所有子元素。 例:div选取div下所有子元素。 |
/ | 从根节点选取子节点。 例:/div选取根元素div |
// |