1、概念:extensive markup language(可扩展的标记语言)
XML是一种通用的数据存储和交换格式,与平台无关,与编程语言无关,与操作系统无关。给数据集成和交互提供了极大的便利。
将数据格式化成XML文件后,真正实现了数据跨平台的交互和共享。在不同语言中,xml的解析方式都一样。
2、XML的解析:xml parse
对xml文件进行阅读和分析,提取出希望的数据和数据属性。在android开发中,将xml解析后,把数据放进List<Map<String, Object>>集合中是我们的最终目的。
3、XML的解析方式:
- DOM(document object model :文档对象模型)【了解】:借助文档树模型对xml文档进行分析
- SAX(simple API for xml :xml的简单api)【了解】:利用事件流的形式解析XML
- PULL【掌握】:利用事件流模型来解析XML
【备注:DOM和SAX解析的优劣分析:DOM是将文档一次性读入到内存,然后以文档树模进行分析节点信息。获取到希望获取的数据;
而SAX是事件流的形式去分析xml文件。DOM可以做到对文档中部分节点的修改、删除和新增,而SAX无法做到。
4、XML文件格式:
1.每个xml文件中要有一个,且只能有一个xml根节点;
2.xml文件的数据中不可以 出现"< "或者" >";
二、DOM解析xml
1、核心类:
DocumentBuilderFactory
DocumentBuilder
Doucment
Element
NodeList
Node
2、核心代码:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 使用工厂来实例化一个构造Document的对象
DocumentBuilder builder = factory.newDocumentBuilder();
// 利用DocumentBuilder来构造一个Document对象
Document document = builder.parse(filename);
// 获取Document文档的根节点对象
Element root = document.getDocumentElement();
// 通过根节点,获取到根节点下面的所有二级子节点
NodeList nodeList = root.getChildNodes();
// 遍历子节点,获取内部的每一个节点
for (int i = 0; i < nodeList.getLength(); i++) {
Node node = nodeList.item(i);
// 获取每个末端阶段的文本值和节点名称,将其存入到Map对象中
map.put(item.getNodeName(), item.getTextContent());
list.add(map);
}
}
三、PULL解析xml:
(一)、核心类:
XmlPullParserFactory
XmlPullParser
(二)、pull解析方式和dom解析的区别:
Android系统本身使用到的各种xml文件,其内部也是采用Pull解析器进行解析的。 Pull解析器的运行方式与 SAX 解析器相似。它提供了类似的事件,如:开始元素和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。
跟SAX不同的是, Pull解析器产生的事件是一个数字,而非方法,因此可以使用一个switch case对感兴趣的事件进行处理,从而可以获取希望获取到的内容,而不用对整个xml文件进行解析。当元素开始解析时,调用parser.nextText()方法可以获取下一个文本节点的值。
(三)、Pull解析中的五个事件类型(PULL PARSER中的几种event值)
1、START_DOCUMENT: 0
2、END_DOCUMENT: 1
3、START_TAG: 2
4、END_TAG: 3
5、TEXT: 4
(四)、核心代码:
- // 实例化一个xml pull解析的工厂
- XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
- // 实例化一个xml pull解析对象
- XmlPullParser pullParser = factory.newPullParser();
- // 将xml文件作为流传入到inputstream
- BufferedInputStream bis = new BufferedInputStream(
- new FileInputStream("customers.xml"));
- // xml解析对象接收输入流对象
- pullParser.setInput(bis, "utf-8");
- int event = pullParser.getEventType();
- List<Map<String, Object>> list = null;
- Map<String, Object> map = null;
- while (event != XmlPullParser.END_DOCUMENT) {
- switch (event) {
-
- case XmlPullParser.START_DOCUMENT:
- list = new ArrayList<>();
- break;
- case XmlPullParser.START_TAG:
- if ("customer".equals(pullParser.getName())) {
- map = new HashMap<String, Object>();
- }
- if (pullParser.getName().equals("name")) {
- map.put("name", pullParser.nextText());
- }
- if (pullParser.getName().equals("tel")) {
- map.put("tel", pullParser.nextText());
- }
- // if (pullParser.getName().equals("email")) {
- // map.put("email", pullParser.nextText());
- // }
- if ("customer".equals(pullParser.getName())) {
- break;
- case XmlPullParser.END_TAG:
- if (pullParser.getName().equals("customer")) {
- list.add(map);
- }
- break;
- case XmlPullParser.START_DOCUMENT:
- }
- event = pullParser.next();
- }
四、补充:(DOM TREE结构中对节点的分类)
1、文档节点
2、元素节点
3、属性节点
4、文本节点
5、注释节点