1、xpath
--一门从html中提取数据的语言
2、xpath的语法
--xpath helper插件:帮助我们从‘elements’中定位数据
--1)选取节点(标签)
---'/html/head/meta'能够选中html下的head下的所有的meta标签
--2)'//':能够从任意节点开始选择
---'//li':当前页面上的所有的li标签
---'/html/head//link'head下的所有的link标签
--3)'@符号的用途'
---选择某个具体元素
'//div[@class='feed-infinite-wrapper']/ul/li'选择class='feed-infinite-wrapper'的div下的ul下的li
---'a/@href':选择a的href的值
--4)获取文本:
----'/a/text()'获取a的文本
----'/a//text()'获取a下的所有文本
5)当前节点: './a'当前节点下的a标签
***************************************************************************
lxml
---安装:pip install lxml
---使用:
from lxml import etree
element =etree.HTML("html 字符串")
element.xpath("")