Python处理XML之DOM解析

本文介绍了一种使用Python的DOM方式解析XML文档的方法,并详细解释了如何读取XML文件中的节点信息,包括属性节点和文本节点。通过示例代码展示了如何获取节点的属性和值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

print "===========DOM方式解析XML文档======================="
'''
DOM 将XML文档定义为如下格式:
根节点
||
元素节点====属性节点
||
元素节点 OR 文本节点 OR CDATA节点
'''
from xml.dom.minidom import *
#传递文件路径或者是文件对象,如果是文件对象,调用parse之后,已经将DOM树加载到了内存
#,可以调用完之后立即关闭
domfile=parse("xmldata.xml")
#DOM以树的方式对xml解析,要求XML文档只能有一个根节点,
root=domfile.documentElement
#xml的DOM树已经加载到内存,因此文件可以关闭了
#可以用getElementsByTag来根据标签名来获取节点
children=root.childNodes
users=[]
user={}
for child in children:
	#跳过空格、回车等Text_Node=3子元素、ELEMENT_NODE=1、ATTRIBUTE_NODE=2
	if child.nodeType==root.ELEMENT_NODE:
		#通过attributes属性获取父节点的所有属性节点,通过方法getAttribute获取指定属性的值
		user.update({"name":child.getAttribute("name")})
		grands=child.childNodes
		for grand in grands:
			#元素节点本身不包含值,只能通过获取被它包含的文本节点、属性节点来读取值
			if grand.nodeType==root.ELEMENT_NODE:
				texts=grand.childNodes
				#Python 2.6以后,文本节点的值通过nodeValue属性获取,而不是text属性
				user.update({"description":texts[0].nodeValue.strip()})
		users.append(user)
		#处理完一个user之后,注意重置中间变量
		user={}
	#DOM将空格、回车等XML格式化的内容认为是文本节点,必须跳过处理
print users
for user in users:
	for item in user.items():
		key,value=item
		print key,value.encode("GBK")

 处理的数据时一样的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值