一、什么xml?
1、定义:可扩展标记性语言
2、特点:xml的是具有自描述结构的半结构化数据。
3、作用:xml主要设计宗旨是用来传输数据的。他还可以作为配置文件。
二、xml和html的区别?
1、语法要求不同:xml的语法要求更严格。
(1)html不区分大小写的,xml区分。
(2)html有时可以省却尾标签。xml不能省略任何标签,严格按照嵌套首位结构。
(3)只有xml中有自闭标签(没有内容的标签,只有属性。)
(4)在html中属性名可以不带属性值。xml必须带属性值。
(5)在xml中属性必须用引号括起来,html中可以不加引号。
2、作用不同:
html主要设计用来显示数据以及更好的显示数据。
xml主要设计宗旨就是用传输数据。
3、标记不同:xml没有固定标记,html的标记都是固定的,不能自定义。
三、xpath
1、什么是xpath?
xpath是一种筛选html或者xml页面元素的【语法】。
2、xml和html的一些名词:
元素、标签、属性、内容
3、xml的两种解析方法:
dom和sax。
4、xpath语法:
(1)选取节点:
nodename — 选取此标签及其所有字标签。
/----从根节点开始选取。
// ----从任意节点开始,不考虑他们的位置。
//book—不管book位置,在xml中取出所有的book标签。
.----当前节点开始找
…----从父节点
@ —选取属性
text()—选取内容
(2)谓语:起限定的作用,限定他前面的内容。
[]写在谁的后面,就限定谁,一般用于限定元素或者标签。
//book[@class=‘abc’]
常见的谓语:
[@class] ----选取有class
[@class=‘abc’] —选取class属性为abc的节点。
[contains(@href,‘baidu’)] —选取href属性包含baidu的标签
xpath提取数据
最新推荐文章于 2025-10-25 10:56:04 发布
本文介绍了XML的基本概念,包括其自描述结构和主要用途。对比了XML与HTML在语法要求、作用和标记方面的差异。接着,重点阐述了XPath的定义,它是一种用于选取XML或HTML页面元素的语法,包括DOM和SAX两种解析方法,并举例说明了XPath的常用语法和谓语的使用。

最低0.47元/天 解锁文章
268

被折叠的 条评论
为什么被折叠?



