Xpath的安装
pip install lxml
生成 HTML 的 DOM 树:
from lxml import etree
page = etree.HTML(html_doc)
page.xpath('//a[@title="data"]') #通过[]来指定标签内属性,@来指定属性
获取两种class的对应链接:/@href
page.xpath('//table[@id = "play"]/tr[@class = "odd" or "even"]/td[@class="text-left"]/a/@href')
通过 text() 与 string() 方法来获得其中的文本:
page.xpath('//li/a/text()')
page.xpath('string(//li[1]/a)')
这篇博客介绍了如何使用Python的lxml库通过XPath安装和解析HTML文档。示例中展示了如何通过属性选择器获取特定元素,如查找title为'data'的a标签,以及如何获取具有特定class的table中链接的href属性。此外,还演示了利用text()和string()方法提取文本内容。
1469

被折叠的 条评论
为什么被折叠?



