XML解析

什么是XML?

XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。

XML 被设计用来传输和存储数据。

XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。

它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。

1.SAX解析:事件驱动解析。不会在内存中加载整个文档,只会根据自己编写的事件保存数据

案列:

from xml.sax import ContentHandler
from xml.dom.minidom import parse
import parser
class Book:
    def __init__(self,bname=None,price=None,author=None):
        self.bname=bname
        self.price=price
        self.author=author
    def __str__(self):
        return '书名:{0}  价格:{1} 作者:{2}'.format(self.bname,self.price,self.author)
lst=[]
class mysaxxml(ContentHandler):
    def __init__(self,bok=None,tag=None):
        self.bok=bok
        self.tag=tag
    def startDocument(self):
        print('startDocument')
    def startElement(self, name, attrs):
        # 将一开始得到的元素节点名字赋值给tag
        self.tag=name
        # 开始时碰见标记book时创建对象并赋值给bok
        if name=='book':
            self.bok=Book()
        print('startElement')
    def characters(self, content):
        # tag获取到的标签分别判断,判断后再赋值
        if self.tag=='bname':
            self.bok.bname=content
        if self.tag=='price':
            self.bok.bname=content
        if self.tag=='author':
            self.bok.bname=content
        print('characters')
    def endElement(self, name):
        # 元素节点结束时如果遇到结尾的book,那么将这个对象添加到这个列表中,对象里面有3个属性值
        if name=='book':
            lst.append(self.bok)
            self.bok=None
        # 每判断一次属性就要将tag清空,比如先判断dname后,那么清空后它又能接着放price了
        self.tag=None
        print('endElement')
    def endDocument(self):
        print('endDocument')

bk=mysaxxml()
parse('../domxml/zy_1.xml',bk)
for i in lst:
    print(i)

2.dom解析:文档对象模型,把解析的xml整个加载到内存,组织成object树。这种方法遍历快,这种方法在加载过程中和sax有显著区别一个是部分加载,另一个是全部加载。

案列:

# DOM解析
from xml.dom.minidom import parse
# 得到整个dom文档树
doc=parse('./domxml/xl_1.xml')
# 得到根节点
root=doc.documentElement
# 根据标签名获取
student=root.getElementsByTagName('stu')
for p in student:
    # 得到stduent下面的name
    # 为什么('name')[0]后面还要加childNodes[0].data呢,不是直接.data,因为他以为后面还是节点,所以要获取
    print(p.getElementsByTagName('name')[0].childNodes[0].data)
    print(p.getElementsByTagName('age')[0].childNodes[0].data)
    print(p.getElementsByTagName('sex')[0].childNodes[0].data)
    print(p.getElementsByTagName('cj')[0].childNodes[0].data)
3.ElementTree解析,也叫元素树解析,和DOM解析差不多,不过方法要比DOM简单
案列:

# 元素树ElementTree解析
from xml.etree.ElementTree import*
class Student:
    def __init__(self,name,age,sex,cj):
        self.name=name
        self.age=age
        self.sex=sex
        self.cj=cj
    def __str__(self):
        return '姓名:{0} 年龄:{1} 性别:{2} 成绩:{3}'.format(self.name,self.age,self.sex,self.cj)
root=parse('./domxml/xl_1.xml')
people=root.findall('stu')
lst=[]
for p in people:
    person=Student(1,2,3,4)#一开始在类的定义中没有设置空值,所以这里可以随便传4个参数进去
    person.name=p.find('name').text
    person.age = p.find('age').text
    person.sex = p.find('sex').text
    person.cj = p.find('cj').text
    lst.append(person)
for i in lst:
    print(i)

豌豆代理(又称豌豆 IP)是一款一站式国内代理 IP 服务平台,主打高匿名、低延迟、高可用的 IP 资源,支持 HTTP/HTTPS/SOCKS5 协议,适配 Windows、Mac、Android、iOS 多平台。 多类型 IP 资源与高覆盖节点 提供动态住宅 IP、静态独享 IP、数据中心 IP,覆盖全国 200 + 城市,可用率 99%+;支持省市精准选择或全国混拨,适配不同业务合规与稳定性需求。 使用:在客户端 “节点 / 线路” 页,按城市 / 类型筛选,一键连接目标 IP,适合爬虫、电商多账号运营等场景。 秒级 IP 切换与灵活调度 支持手动一键切换、秒级动态切换(切换速度低至 100ms)、定时切换(自定义时长),并自动过滤重复 IP,避免重复使用导致风险。 使用:在 “设置” 中开启 “自动切换” 并设时间间隔,或按 Ctrl+Q 快捷键一键换 IP,适配反爬虫、批量测试等高频切换场景。 全协议支持与多端适配 兼容 HTTP/HTTPS/SOCKS5 主流代理协议,可对接浏览器、爬虫脚本、客户端软件;支持 Windows、Mac、安卓、iOS 多端同步使用,跨设备无缝切换。 使用:在客户端 “协议设置” 选择对应协议,生成代理地址与端口,直接填入目标软件即可生效。 隐私安全与数据加密 自研传输加密技术保护数据传输,搭配高匿名 IP 隐藏真实地址,同时支持自动清除 Cookie / 缓存,降低隐私泄露与追踪风险。 使用:在 “安全设置” 中开启 “数据加密” 与 “自动清理缓存”,公共 WiFi 环境下优先启用,提升隐私防护等级。 智能筛选与稳定网络优化 系统自动筛选低延迟、高可用 IP,过滤失效 / 重复地址;依托自建纯净机房与独享带宽,搭配 BGP 多线接入,保障连接稳定性与速度。 使用:无需手动配置,客户端默认智能匹配合适节点,复杂网络环境可在 “网络
在网络高速发展的时代,众多的软件被开发出来,给用户带来了很大的选择余地,而且人们越来越追求更个性的需求。在这种时代背景下,商家只能以用户为导向,以商品的持续创新作为商家最重要的事项。 在新发展的时代,人们对幼儿资源互助共享平台越来越重视,才能实现幼儿资源互助共享平台的有效发挥,本文将通过幼儿资源互助共享平台的信息,分析在日常生活中对幼儿资源互助共享平台存在哪些问题探讨出进一步提升效率,管理能力的对策。 系统采用了Java技术,将所有模块采用以浏览器交互的模式,选择MySQL作为系统的数据库,来进行系统的设计。基本实现了幼儿资源互助共享平台应有的主要功能模块,本系统有管理员:首页、个人中心、用户管理、卖家管理、咨询师管理、萌宝信息管理、幼儿知识管理、保姆推荐管理、音频资源管理、二手商品管理、商品分类管理、资源分类管理、交流论坛、系统管理,用户;首页、个人中心、萌宝信息管理、保姆推荐管理、音频资源管理,卖家;首页、个人中心、二手商品管理、订单管理,咨询师;首页、个人中心、幼儿知识管理,前台首页;首页、萌宝信息、幼儿知识、保姆推荐、音频资源、二手商品、交流论坛、个人中心、后台管理、购物车等功能。 对系统进行测试后,改善了程序逻辑和代码。同时确保系统中所有的程序都能正常运行,所有的功能都能操作,本系统的开发获取幼儿资源互助共享平台信息能够更加方便快捷,同时也使幼儿资源互助共享平台信息变的更加系统化、有序化。系统界面较友好,易于操作。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值