5.XML技术

本文介绍了XML的基础语法,包括DTD约束、Schema约束和引用约束,并通过XPath实例展示了如何在解析器中应用这些知识。重点讲解了DTD元素声明、属性声明、Schema的命名空间和约束元素,以及XPath的使用技巧。

目录

一、xml的基础语法。

DTD约束文档:

Schema约束文档:

引用约束文档:

二、解析器。

XPath案例:


一、xml的基础语法。

953bee42492d433db3c5a7cbc0a2d9ef.png

(1)DTD约束文档:

在DTD(文档类型定义)中规定的XML元素必须按特定顺序放置才能被视为合法,这些顺序可以通过在DTD中定义元素的内容模型来指定。 

<!DOCTYPE students [
        <!ELEMENT students (student*) >//*声明出现零次或多次的元素
        <!ELEMENT student (name,age,sex)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ELEMENT sex (#PCDATA)>
        <!ATTLIST student number ID #REQUIRED>
        ]>

声明一个元素
在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:
<!ELEMENT element-name category>或<!ELEMENT element-name (element-content)>

PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。
CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

dtd实体:
DTD 实例:
<!ENTITY writer "Donald Duck.">
<!ENTITY copyright "Copyright runoob.com">
XML 实例:
<author>&writer;&copyright;</author>
注意: 一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)。

声明属性 :在DTD 中,属性通过 ATTLIST 声明来进行声明。
属性声明使用下列语法:元素名 属性名 属性类型(如ID表示唯一) 属性值(#REQUIRED	属性值是必需的,
#IMPLIED	属性不是必需的,#FIXED value	属性值是固定的)
<!ATTLIST element-name attribute-name attribute-type attribute-value>

(2)Schema约束文档:

 重要笔记:

xmlns:给命名空间起一个唯一名字或默认(不命名前缀,则默认使用)。

xsi:schemaLocation:命名空间  约束文件的路径(前面的命名空间必须和该约束文档里面定义的命名空间一样才行)。

targetNamespace:给该约束文档起一个命名空间。

注意:这两个命名空间不需要引入xsd约束文件。

xmlns="http://maven.apache.org/POM/4.0.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

<?xml version="1.0" encoding="UTF-8" ?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
//固定写法,因为要用该名称空间下的名称(如element、name、type等,xs是别名,不起别名就要用http://www.w3.org/2001/XMLSchema这个名称空间替换别名)
           xmlns="http://www.itcast.cn/xml"
//给当前约束文档定义一个名称空间,自己定义
            targetNamespace="http://www.itcast.cn/xml" elementFormDefault="qualified">
//targetNamespace指目标名称空间:使用该约束文档要用的,和该约束文档名称空间一致。
//elementFormDefault可以不用,不会有什么问题。
    <xs:element name="students" type="studentsType"/>
    <xs:complexType name="studentsType">
        <xs:sequence>
            <xs:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xs:sequence>
    </xs:complexType>
    <xs:complexType name="studentType">
        <xs:sequence>
            <xs:element name="name" type="xs:string"/>
            <xs:element name="age" type="ageType"/>
            <xs:element name="sex" type="sexType"/>
        </xs:sequence>
        <xs:attribute name="number" type="numberType" use="required"/>
    </xs:complexType>
    <xs:simpleType name="ageType">
        <xs:restriction base="xs:integer">
            <xs:minInclusive value="0"/>
            <xs:maxInclusive value="256"/>
        </xs:restriction>
    </xs:simpleType>
    <xs:simpleType name="sexType">
        <xs:restriction base="xs:string">
            <xs:enumeration value="male"/>
            <xs:enumeration value="female"/>
        </xs:restriction>
    </xs:simpleType>
    <xs:simpleType name="numberType">
        <xs:restriction base="xs:string">
            <xs:pattern value="heima_\d{4}"/>
        </xs:restriction>
    </xs:simpleType>
</xs:schema>

引用约束文档:

<a:students xmlns:xs="http://www.w3.org/2001/XMLSchema-instance"
          xs:schemaLocation="http://www.itcast.cn/xml student.xsd
                             http://www.itcast.cn/xml student.xsd //第二个约束文档位置   
                                                                 "
//xs名称空间下的schemalacaton表示:名称空间http://www.itcast.cn/xml所在的约束文件位置或地址。
          xmlns:a="http://www.itcast.cn/xml"
//引入约束文档的约束空间,前缀为a
            xmlns="http://www.itcast.cn/xml"
//引入第二个约束文档,不同约束文档之间前缀不能相同,但是只有一个约束文档可以省略,或者有一个省略。
        >
<!--    显示 schema 中用到的元素和数据类型来自命名空间 "http://www.w3.org/2001/XMLSchema-instance"。
同时它还规定了来自命名空间 "http://www.w3.org/2001/XMLSchema" 的元素和数据类型应该使用前缀 xs:-->

    //使用第一个名称空间的约束
    <a:student number="heima_0001">
        <a:name>zhangsna</a:name>
        <a:age>22</a:age>
        <a:sex>male</a:sex>
    </a:student>
    //使用第二个名称空间的约束,但是引入的两个约束文档是同一个,所以这里没意义(使用一种就够了)。
    <student number="heima_0000">
        <name>a</name>
        <age>2</age>
        <sex>female</sex>
    </student>

</a:students>

二、解析器。

f7bbb12d131a41899b4ac615ba788d4f.png

XPath案例:

public class Demo {
    public static void main(String[] args) throws IOException, XpathSyntaxErrorException {
        Document document = Jsoup.parse(new File("src/student.xml"));
        //1.根据document对象,创建JXDocument对象
        JXDocument jxDocument=new JXDocument(document);
        //2.结合xpath语法查询
        //2.1查询所有student标签
        List<JXNode> jxNodes = jxDocument.selN("//student");
        for (JXNode jx:jxNodes) {
            System.out.println(jx);
//            Element element = jx.getElement();
        }
        System.out.println("-------------------");
        //2.2查询所有student标签下的name标签
        List<JXNode> jxNodes1 = jxDocument.selN("//student/name");
        for (JXNode j : jxNodes1) {
            System.out.println(j);
        }
        System.out.println("---------------------");
        //2.3查询student标签下带有id属性的name标签
//        List<JXNode> jxNodes2 = jxDocument.selN("//student[@number]/name[@id]");//增加了条件
        List<JXNode> jxNodes2 = jxDocument.selN("//student/name[@id]");
        for (JXNode j2: jxNodes2) {
            System.out.println(j2);
        }
        System.out.println("-------------------");
        //2.4查询student标签下带有id属性的name标签,并且id属性值为itcast
        List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id='itcast']");
        for (JXNode j3: jxNodes3) {
            System.out.println(j3);
        }
    }
}

笔记:xpath是不属于jsoup解析器的。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值