python解析XML:ElementTree(元素树)



 ElementTree就像一个轻量级的DOM,具有方便友好的API。代码可用性好,速度快,消耗内存少。



<root>  
 <person age="18">  
    <name>hzj</name>  
    <sex>man</sex>  
 </person>  
 <person age="19" des="hello">  
    <name>kiki</name>  
    <sex>female</sex>  
 </person>  
</root>


1.加载xml文件

    加载XML文件共有2种方法,一是加载指定字符串,二是加载指定文件


2.获取element的方法

  a) 通过getiterator

  b) 过 getchildren

  c) find方法

  d) findall方法


  1. <span style="font-size: 13px;">#-*- coding:utf-8 -*-  
  2. from xml.etree import ElementTree  
  3. def print_node(node):  
  4.     '''''打印结点基本信息'''  
  5.     print "=============================================="  
  6.     print "node.attrib:%s" % node.attrib  
  7.     if node.attrib.has_key("age") > 0 :  
  8.         print "node.attrib['age']:%s" % node.attrib['age']  
  9.     print "node.tag:%s" % node.tag  
  10.     print "node.text:%s" % node.text  
  11. def read_xml(text):  
  12.     '''''读xml文件'''  
  13.     # 加载XML文件(2种方法,一是加载指定字符串,二是加载指定文件)      
  14.     # root = ElementTree.parse(r"D:/test.xml")  
  15.     root = ElementTree.fromstring(text)  
  16.       
  17.     # 获取element的方法  
  18.     # 1 通过getiterator   
  19.     lst_node = root.getiterator("person")  
  20.     for node in lst_node:  
  21.         print_node(node)  
  22.           
  23.     # 2通过 getchildren  
  24.     lst_node_child = lst_node[0].getchildren()[0]  
  25.     print_node(lst_node_child)  
  26.           
  27.     # 3 .find方法  
  28.     node_find = root.find('person')  
  29.     print_node(node_find)  
  30.       
  31.     #4. findall方法  
  32.     node_findall = root.findall("person/name")[1]  
  33.     print_node(node_findall)  
  34.       
  35. if __name__ == '__main__':  
  36.      read_xml(open("test.xml").read())  
  37.  </span>  
#-*- coding:utf-8 -*-
from xml.etree import ElementTree
def print_node(node):
    '''打印结点基本信息'''
    print "=============================================="
    print "node.attrib:%s" % node.attrib
    if node.attrib.has_key("age") > 0 :
        print "node.attrib['age']:%s" % node.attrib['age']
    print "node.tag:%s" % node.tag
    print "node.text:%s" % node.text
def read_xml(text):
    '''读xml文件'''
    # 加载XML文件(2种方法,一是加载指定字符串,二是加载指定文件)    
    # root = ElementTree.parse(r"D:/test.xml")
    root = ElementTree.fromstring(text)
    
    # 获取element的方法
    # 1 通过getiterator 
    lst_node = root.getiterator("person")
    for node in lst_node:
        print_node(node)
        
    # 2通过 getchildren
    lst_node_child = lst_node[0].getchildren()[0]
    print_node(lst_node_child)
        
    # 3 .find方法
    node_find = root.find('person')
    print_node(node_find)
    
    #4. findall方法
    node_findall = root.findall("person/name")[1]
    print_node(node_findall)
    
if __name__ == '__main__':
     read_xml(open("test.xml").read())
 



想想为什么?不明白,请看下面

  1. #encoding=utf-8  
  2. from xml.etree import ElementTree as ET  
  3. #要找出所有人的年龄  
  4. per=ET.parse('test.xml')  
  5. p=per.findall('/person')  
  6. for x in p:  
  7.     print x.attrib  
  8. print  
  9. for oneper in p:  #找出person节点  
  10.     for child in oneper.getchildren(): #找出person节点的子节点  
  11.         print child.tag,':',child.text  
  12.   
  13.     print 'age:',oneper.get('age')  
  14.     print '############'  
#encoding=utf-8
from xml.etree import ElementTree as ET
#要找出所有人的年龄
per=ET.parse('test.xml')
p=per.findall('/person')
for x in p:
    print x.attrib
print
for oneper in p:  #找出person节点
    for child in oneper.getchildren(): #找出person节点的子节点
        print child.tag,':',child.text

    print 'age:',oneper.get('age')
    print '############'


结果如下:

  1. {'age''18'}  
  2. {'age''19''des''hello'}  
  3.   
  4. name : hzj  
  5. sex : man  
  6. age: 18  
  7. ############  
  8. name : kiki  
  9. sex : female  
  10. age: 19  
  11. ############  


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值