使用SAX和DOM解析XML
1. 使用SAX解析XML
在大多数情况下,从XML文档中提取信息的最佳方法是使用符合SAX(Simple API for XML)的事件驱动解析器来解析文档。SAX定义了一个标准API,可以在许多不同的底层解析器之上实现。SAX解析方法与大多数HTML解析器有相似之处。当解析器遇到XML元素、文本内容和输入流中的其他重要事件时,它会回调你定义的类的方法。这种基于事件发生时回调方法的事件驱动解析方式,与GUI和一些优秀的可扩展网络框架(如Twisted)中的事件驱动方法类似。事件驱动方法对初学者来说可能不那么自然,但它能实现高性能和高可扩展性,非常适合高负载的情况。
1.1 使用SAX的步骤
- 定义一个内容处理程序类,继承自库中的类并覆盖一些方法。
- 构建一个解析器对象
p,将你定义的类的实例设置为p的处理程序。 - 向
p提供输入流进行解析,p会调用处理程序的方法来反映文档的结构和内容,处理程序的方法执行特定于应用程序的处理。
xml.sax 包提供了一个工厂函数来构建解析器 p ,以及在典型情况下进行更简单操作的便利函数,同时还提供了异常类,用于在输入无效和其他错误情况下抛出异常。
1.2 xml.sax 包的函数
| 函数名 |
|---|
超级会员免费看
订阅专栏 解锁全文
2

被折叠的 条评论
为什么被折叠?



