Python3 P y t h o n 3 –爬虫之Xpath使用
准备工具:
Google Chromexpath-helper.crx
- 百度网盘链接:https://pan.baidu.com/s/15XqmdvWgxNqC7Cvd_aPuOw
- 密码:ixsh
使用:将xpath-helper.crx拖放到浏览器chrome://extensions/下,即可完成安装。Ctrl+Shift+X快捷键调用
Xpath语法
xpath helper插件:帮助我们从elements中定位数据-
- 选择节点(标签)
/html/head/meta:能够选中html下的head下的meta标签
//:能够从任意节点开始选择
//li:当前节点下的所有的li标签
@符号的用途
- 定位具体元素:
//div[@class = ''] a/@href:选择a的href的值
- 定位具体元素:
- 获取文本
/a/text():获取a标签下的文本内容
- 选择节点(标签)
lxml使用
安装
pip install lxml使用
from lxml import etree element = etree.HTML("html字符串") element.xpath("规则")

1443

被折叠的 条评论
为什么被折叠?



