#coding=gbk
import lxml.etree
import lxml.html as x
f=open('f:/test.html','r')
c=f.read()
doc=x.document_fromstring(c)
alist=doc.xpath("//a")
for a in alist:
tree=lxml.etree.ElementTree(a)
print tree.getpath(a)
利用lxml,得到html元素的绝对xpath路径
最新推荐文章于 2024-12-06 22:45:18 发布
本文介绍了一种利用Python的lxml库解析HTML的方法。通过读取本地HTML文件,使用lxml.etree和lxml.html模块将文件内容转换为文档对象模型(DOM),并遍历文档中的所有<a>标签,输出每个<a>标签的路径。
22万+

被折叠的 条评论
为什么被折叠?



