Python 语言之 - 解析XML

可扩展标记语言,即 XML,其标准通过柔性的方法创建格式化的信息,通过互联网络进行电子化的结构化数据分享,效果如同协同化的企业网络。

XML 解析器

文档对象模型 DOM 定义了访问和处理文档的标准 , XML DOM 定义了访问和处理 XML 文档的标准,以树型结构表示文档。

XML 的解析

Python 解析 XML文档有几种方法。包括传统的 DOM,以及 简单应用程序接口 SAX(Simple API for XML)解析器。
下面主要描述内置的 xml 模块解析方法。

XML 文档实例

<data>
     <items>
         <item name="产品1"></item>
         <item name="产品2"></item>
         <item name="产品3"></item>
         <item name="产品4"></item>
         <item name="产品5"></item>
     </items> 
</data>   

将上面的文本保存成文件,名称为 “data.xml”,以备实验之用。

XML 接口

xml.etree.ElementTree 模块实现了处理XML数据的方法。元素类型是柔性的容器对象,可以在内存里面存储结构化数据。

例子

import xml.etree.ElementTree 
doc = xml.etree.ElementTree.parse('data.xml').getroot() 
for elem in doc.findall('items/item'):
     print (elem.get('name'))      

输出结果

DOM 的最小实现模块

DOM 实例

xml.dom.minidom 是一个DOM接口的最小化实现,和其他语言类似,目的是保持比较小的程序规模。一般初学者可以使用 xml.etree.ElementTree 模块更方便。

例子

from xml.dom import minidom 
xmldoc = minidom.parse('data.xml') 
product_list = xmldoc.getElementsByTagName('item') 
print("项数量 : ", len(product_list)) 
for product in product_list:
     print(product.attributes['name'].value)      

输出结果

更多内容待续......

Python 终止程序
Python 随机数
Python 异常处理
Python 日期和时间
Python 多线程套接字
Python 套接字
Python FTP
Python 网页
Python 访问Web

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Suprman

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值