python中lxml库的使用简介

  

目录

1.ElementTree 类

2.Element 类

3.ElementTree 类或 Element 类的查找方法


      为方便开发人员在程序中使用 XPath 的路径表达式提取节点对应的内容, Python 提供了
第三方库 lxml 。开发人员通过 lxml 库可以轻松地对 HTML XML 文档中的目标节点进行定
位并提取。这里以 4.6.3 版本的 lxml 库为例进行介绍。
        在 lxml 库中,大多数有关解析网页数据的功能都封装到 etree 模块中, etree 模块包含了
两个比较重要的类,它们分别是 ElementTree 类和 Element 类,关于这两个类的相关内容的介
绍如下。

1.ElementTree 类

        ElementTree 类的对象可以理解为一个 HTML XML 文档的节点树。为方便开发者将
HTML XML 文档转换为 ElementTree 类的对象, etree 模块中提供了一个 parse() 函数。 parse()
函数的声明如下。
parse(source, parser=None, base_url=None)
上述函数中各参数的含义如下。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值