XML 文档解析:DOM、SAX 和 StAX 方法详解
1. XML 解析的目标
解析 XML 文档是处理 XML 数据的基础,通常有三个主要目标:
- 确保文档格式良好。
- 检查文档是否符合 DTD 或 XML Schema 指定的结构。
- 以满足应用程序特定需求的方式访问和可能修改文档中指定的各种元素和属性。
目前,有三种不同的 XML 文档解析方法:
- DOM 解析
- 推式解析
- 拉式解析
2. 解析方法概述
2.1 DOM 方法
DOM(Document Object Model)将文档表示为节点对象的树结构。为了表示 XML 文档的结构,通用的 Node 类型被专门化为其他 Node 类型,每种专门的节点类型指定了一组允许的子节点类型,如下表所示:
专门的节点类型 | 描述 | 允许的子节点类型 |
---|---|---|
Document | 表示一个 XML 文档 | DocumentType、ProcessingInstruction、Comment、Element(最多 1 个) |
DocumentFragment | 表示 XML 文档的一部分 | Element、ProcessingInstructio |