一:XML
1:XML简介
1.1:XML(eXtensiblle Markup Language),客户、可扩展标记语言,是一种标记语言。
1.2:XML是一种非常灵活的语言,没有固定的标签,所有的标签都可以自定义。
1.3:通常,XML被用于信息的记录和传递,因此,XML经常被用于充当配置文件
2:格式良好的XML
2.1:声明信息,用于描述xml的版本和编码方式
<?xml version="1.0" encoding="UTF-8"?>
2.2:XML有且仅有一个根元素
2.3:XML是大小写敏感的
2.4:标签是成对的,而且要正确嵌套
2.5:属性值要引用双引号
3:例子
<?xml version="1.0" encoding="UTF-8"?>
<!-- 这里是注释 -->
<books>
<book id="b01">
<name>java高级编程</name>
<author>张三</author>
<price>50.5</price>
</book>
<book id="b02">
<name>java中级编程</name>
<author>李四</author>
<price>30.5</price>
</book>
</books>
二:DTD
1:DTD简介
1.1:DTD(Document Type Definition),文档类型定义。
1.2:DTD用于约束xml的文档格式,保证xml是一个有效的xml。
1.3:DTD可以分为两种,内部DTD,外部DTD。
2:使用DTD
2.1:内部DTD的定义
2.1.1:语法如下
<!DOCTYPE 根元素 [元素声明]>
2.1.2:元素声明语法
<!ELEMENT 元素名 (子元素[, 子元素...])>
2.1.3:数量词
+: 表示出现 1 次或多次, 至少一次
?: 表示出现 0 次或 1 次
*: 表示出现任意次
2.1.4:属性声明语法
属性类型: CDATA, 表示字符数据(character data)
默认值:
- #REQUIRED, 表示必须出现
- #IMPLIED, 表示不是必须的
<!ATTLIST 元素名称 属性名称 属性类型 默认值>
2.1.5:带DTD的完整xml代码
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE scores [
<!ELEMENT scores (student+)>
<!ELEMENT student (name, course, score)>
<!ATTLIST student id CDATA #REQUIRED>
<!ELEMENT name (#PCDATA)>
<!ELEMENT course (#PCDATA)>
<!ELEMENT score (#PCDATA)>
]>
<scores>
<student id="1">
<name>王同</name>
<course>java</course>
<score>89</score>
</student>
<student id="2">
<name>李佳</name>
<course>sql</course>
<score>58</score>
</student>
</scores>
2.2:外部DTD的定义
2.2.1:创建一个DTD文件
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT scores (student+)>
<!ELEMENT student (name, course, score)>
<!ATTLIST student id CDATA #REQUIRED>
<!ELEMENT name (#PCDATA)>
<!ELEMENT course (#PCDATA)>
<!ELEMENT score (#PCDATA)>
2.2.2:在XML中引入外部DTD
<!-- 引入外部DTD文件 -->
<!DOCTYPE scores SYSTEM "scores.dtd">
三:XML的解析
对XML文件进行操作,包括创建XML,对XML进行增删改查操作。
1:XML解析技术
DOM 解析是官方提供的解析方式, 基于 xml 树解析的
SAX 解析是民间的解析方式, 基于事件的解析
JDOM 解析第三方提供, 开源免费的解析方式, 比 DOM 解析快
DOM4J 解析是第三方提供, 开源免费, 是 JDOM 的升级版
2: DOM4J解析XML
需要导入 dom4j 的 jar 包, 解析 xml 的入口, 是需要先拿到一个 Document 对象
2.1:生成XML中的信息
package xml;
import java.io.File;
import java.io.FileWriter;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
public class XMLWriterTest {
public static void main(String[] args) throws Exception {
// [1] 通过DocumentHelper生成一个Document对象
Document doc = DocumentHelper.createDocument();
// [2] 添加并得到根元素
Element root = doc.addElement("books");
// [3] 为根元素添加子元素
Element book = root.addElement("book");
// [4] 为book元素添加属性
book.addAttribute("id", "b01");
// [5] 为book添加子元素
Element name = book.addElement("name");
Element author = book.addElement("author");
Element price = book.addElement("price");
// [6] 为子元素添加文本
name.addText("Thinking in Java");
author.addText("小伟");
price.addText("88");
// [7] 格式良好的输出
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileWriter(new File("src/book1.xml")), format);
writer.write(doc);
// [8] 关闭资源
writer.close();
}
}
2.2:读取XML信息
package xml;
import java.io.File;
import java.util.Iterator;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class XMLReaderTest{
public static void main(String[] args) throws Exception {
// [1] 创建SAXReader对象, 用于读取xml文件
SAXReader reader = new SAXReader();
// [2] 读取xml文件, 得到Document对象
Document doc = reader.read(new File("src/book1.xml"));
// [3] 获取根元素
Element root = doc.getRootElement();
// [4] 获取根元素下所有子元素
Iterator<?> it = root.elementIterator();
while(it.hasNext()) {
// 取出元素
Element e = (Element) it.next();
System.out.println(e.getName());
// 获取id属性
Attribute id = e.attribute("id");
System.out.println(id.getName() + "=" + id.getValue());
// 获取student的子元素
Element name = e.element("name");
Element author = e.element("author");
Element price = e.element("price");
// 打印
System.out.println(name.getName()+ "=" + name.getStringValue());
System.out.println(author.getName() + "=" + author.getText());
System.out.println(price.getName() + "=" + price.getText());
System.out.println("--------------------------------------");
}
}
}