Python 中 XML 处理与 Unicode 应用全解析
1. XML 解析之 SAX 方法
SAX(Simple API for XML)接口最初在 Java 中开发,如今在多数语言中都有实现。Python 2 支持 SAX2,其接口功能丰富。Python 为 SAX 解析器提供了基础接口、异常处理系统、用于创建 SAX 处理程序的基类集合,以及用于构建基于 SAX 的底层解析器的底层接口。
SAX 的工作方式是接受一个事先创建好的内容处理类,用于处理不同的元素。其原理与 Expat 类似,但创建的类专门用于支持不同元素的处理方法。SAX 会处理所有的数据读取,并将信息提供给解析器。
以下是一个使用 SAX 输出示例文件中开始和结束标签的脚本:
from xml.sax import make_parser
from xml.sax.handler import ContentHandler
# 定义一个新的内容处理类,定义的方法将在 XML 文档中找到单个元素时触发
class FindStartEnd(ContentHandler):
def __init__(self):
pass
def startElement(self, name, attrs):
print 'Start: ', name, attrs
def endElement(self, name):
print 'End: ', name
# 创建一个新的解析器
parser = make_parser()
# 根据我们的类创建一个新的
Python XML与Unicode处理详解
超级会员免费看
订阅专栏 解锁全文
1100

被折叠的 条评论
为什么被折叠?



