python解析XML常见方法

python解析XML常见的有三种方法:

一是xml.dom.*模块,它是W3C DOM API的实现,若需要处理DOM API则该模块很适合,注意xml.dom包里面有许多模块,须区分它们间的不同;

二是xml.sax.*模块,它是SAX API的实现,这个模块牺牲了便捷性来换取速度和内存占用,SAX是一个基于事件的API,这就意味着它可以“在空中”处理庞大数量的的文档,不用完全加载进内存;

三是xml.etree.ElementTree模块(简称 ET),它提供了轻量级的Python式的API,相对于DOM来说ET 快了很多,而且有很多令人愉悦的API可以使用,相对于SAX来说ET的ET.iterparse也提供了 “在空中” 的处理方式,没有必要加载整个文档到内存,ET的性能的平均值和SAX差不多,但是API的效率更高一点而且使用起来很方便。

xml.etree.ElementTree

ElementTree生来就是为了处理XML,它在Python标准库中有两种实现:
一种是纯Python实现的,如:xml.etree.ElementTree,
另一种是速度快一点的xml.etree.cElementTree。
注意:尽量使用C语言实现的那种,因为它速度更快,而且消耗的内存更少。

try: 
    import xml.etree.cElementTree as ET 
except ImportError: 
    import xml.etree.ElementTree as ET 

这是一个让Python不同的库使用相同API的一个比较常用的办法,而从Python 3.3开始ElementTree模块会自动寻找可用的C库来加快速度,所以只需要import xml.etree.ElementTree就可以了。
#!/usr/bin/evn python
#coding:utf-8

try: 
  import xml.etree.cElementTree as ET 
except ImportError: 
  import xml.etree.ElementTree as ET 
import sys 

try: 
  tree = ET.parse("country.xml")     #打开xml文档 
  #root = ET.fromstring(country_string) #从字符串传递xml 
  root = tree.getroot()         #获得root节点  
except Exception, e: 
  print "Error:cannot parse file:country.xml."
  sys.exit(1) 
print root.tag, "---", root.attrib  
for child in root: 
  print child.tag, "---", child.attrib 

print "*"*10
print root[0][1].text   #通过下标访问 
print root[0].tag, root[0].text 
print "*"*10

for country in root.findall('country'): #找到root节点下的所有country节点 
  rank = country.find('rank').text   #子节点下节点rank的值 
  name = country.get('name')      #子节点下属性name的值 
  print name, rank 

#修改xml文件 
for country in root.findall('country'): 
  rank = int(country.find('rank').text) 
  if rank > 50: 
    root.remove(country) 

tree.write('output.xml') 

参考:
https://www.jb51.net/article/63780.htm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值