转载请注明出处:http://blog.youkuaiyun.com/skyunicorn/article/details/51002970,谢谢
一、概述
XML文件是一种可扩展标记语言,标准通用标记语言的子集。
1.什么是可扩展标记语言?
可扩展标记语言是一种很像超文本标记语言的标记语言。
它的设计宗旨是传输数据,而不是显示数据。
它的标签没有被预定义。您需要自行定义标签。
它被设计为具有自我描述性。
它是W3C的推荐标准。
2.可扩展标记语言和超文本标记语言之间的差异
它不是超文本标记语言的替代。
它是对超文本标记语言的补充。
它和超文本标记语言为不同的目的而设计:
它被设计用来传输和存储数据,其焦点是数据的内容。
超文本标记语言被设计用来显示数据,其焦点是数据的外观。
超文本标记语言旨在显示信息,而它旨在传输信息。
对它最好的描述是:它是独立于软件和硬件的信息传输工具。
二、结构
1.XML文件是一种树形结构
XML 文档必须包含根元素。该元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。
所有元素均可拥有子元素
父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。
所有元素均可拥有文本内容和属性(类似 HTML 中)。
2、根元素
根元素的开始和结束标记用于包围 XML文档的内容。一个文件只能有一个根元素,并且需要使用 “包装器”包含它。下面 显示了一个示例。
<NewDataSet xmlns="">
<Table diffgr:id="Table1" msdata:rowOrder="0">
<Customer>张三</Customer>
<Tel>110</Tel>
<Address>世贸大厦</Address>
<CompShort>某某集团</CompShort>
</Table>
<Table diffgr:id="Table2" msdata:rowOrder="1">
<Customer>李四</Customer>
<Tel>120</Tel>
<Address>中心医院</Address>
<CompShort>某某集团</CompShort>
</Table>
</NewDataSet>
根节点:NewDataSet
子元素节点:Table
Table下面成对的是属性,属性里面是文本内容,即我们需要获取的资源。
如果出现<A/>或者<A></A>(2个标签中间没有数据)说明这是一个空标签。
有些人可能分不出来哪个是根节点,一般来说出现NewDataSet,这个就一定是根节点。如果不清楚,也可以倒着看:现看成对中夹杂内容的,例如上面的<Tel>120</Tel>,这个一定是属性,里面的是内容,然后倒着判断,包裹属性的<Table></Table>一定是元素节点,那么元素节点外面的<NewDataSet></NewDataSet>就是根节点了。
熟悉了XML的结构,才能方便我们解析XML的内容。