Xpath解析
笔者之前有写过Beautifulsoup4,而xpath 同样也是一种 与Beautifulsoup4 目的一样的一个包,而且xpath的速度要比Beautifulsoup4要快。当然对于解析最快的就是RE(正则表达式)
但是也是最难的
安装
pip install parsel 安装parsel包 里面就包含xpath
语法
表达式 | 描述 |
---|---|
nodename | 选中该元素 |
/ | 从根节点选取,或者是元素和元素间的过度 |
// | 直接选择到整个文本中的某一个节点 |
. | 选取当前节点 |
. . | 选取当前节点的父节点 |
@ | 选取当前节点的属性 |
text() | 选取当前节点的文本 |
contains() | 包含 |