XML 被设计用来传输和存储数据。
HTML 被设计用来显示数据。
XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。
xpath语法语法需要注意的知识点。
- 1 /和//的区别:/代表只获取直接子节点,//获取子孙节点,一般//用的比较多,当然也要视情况而定
//@class 选择名为class的所有属性
- 2 contains: 有时候某个属性中包含了多个值,那么可以使用‘contains’函数,实例代码如下:
//div[contains(@class,'job_detai')]
- 3 谓词中的小标是从0开始的,而不是类似python从0开始
//div[1] 选择第一个div元素
//div[last()] 选择最后一个div元素
//div[position()<3] 选择最前面的两个div元素
- 4
//div[@class='eng'] 选取所有 div元素,且这些元素拥有值为 eng 的 class 属性。