XML究竟是什么

XML是一种可扩展标记语言,允许用户自定义标签,常用于数据存储和交换。它不同于固定标签的HTML,是元语言的一种,可用于创建新的标记语言。XML命名空间避免了标签冲突,而SOAP利用XML实现跨平台的分布式计算。XML在互联网环境中能发挥其优势,便于不同应用间的数据交互。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

XML究竟是什么

XML是Extensible Markup Language的缩写,译为可扩展标记语言。

1.XML是标记语言

通过添加标签为数据赋予意义的行为称为“标记”。为“标记”定义规则的语言就是“标记语言”。

例如用于编写网页的HTML(Hypertext Markup Language,超文本标记语言)就是一种标记语言。下图是腾讯视频网页版的首页:
在这里插入图片描述
像这种网页就是一个HTML文件。在网页空白处右键点击查看网页源代码就能看到,如下图(只是一部分)。其部署在web服务器上,Web浏览器会对HTML的标签进行解析,把由它们标记的信息渲染成在视觉上可以阅读的网页。
在这里插入图片描述

可以看到里面有很多用“<”和“>”括起来的单词,通常把它们称作“标签”。html是用于表示这是HTML文件的标签,head表示网页的头部,title表示网页的标题,body表示网页的主体。除此之外还有很多标签,例如使文字加粗显示的b、在网页中插入图片的img,等等。

2.XML是可扩展语言
在这里插入图片描述
这是一个XML文件,可以看到有很多标签,而且XML允许XML的使用者随心所欲地创建标签。也就是说,在“<”和“>”中的单词可以是任意的。这就是所谓的“可扩展”。

所以XML可以使用标签为数据赋予意义,这样计算机就可以轻松从中提取需要的数据。比如10000这个数据,可以起个名字<月收入>,如果要从XML文件中提取这个数据,只需要用这个名字就行。

而在HTML中,只能使用由HTML定义出的那若干种标签,因此HTML是固定的标记语言。

3.XML是元语言

通常把用于创造语言的语言称作“元语言”。XML可以通过定义要使用的标签种类,创造出一门新的标记语言。

例如,我们可以使用dog和cat等标签,创造一种属于自己的标记语言——宠物语言。但这种语言也要遵循一定的规范,不然就不是符合XML格式的语言。下图为XML中的主要约束:
在这里插入图片描述
现在的Web浏览器都集成了XML解析器,可以用这个功能来检查XML文件的书写格式。

4.XML命名空间

为了防止同形异义带来的混乱(如下图),引进XML命名空间。

在这里插入图片描述
在XML文档中,通过把“xmlns=“命名空间的名字””作为标签的一个属性记述,就可以为标签设定命名空间。xmlns即XML NameSpace(命名空间)的缩写。通常用全世界唯一的标识符作为命名空间的名称,这里使用公司的URL,如下图:
在这里插入图片描述
5.SOAP

SOAP(Simple Object Access Protocol,简单对象访问协议)可用于分布式计算。所谓分布式计算,就是把程序分散部署在用网络连接起来的多台计算机上,使这些计算机相互协作,充分发挥计算机整体的计算能力。所以说,SOAP就是使运行在A公司计算机中的A程序,可以调用运行在B公司计算机中的B程序。

无论是调用程序时所需的参数信息,还是程序执行后的返回结果,都可以用通用的数据格式XML表示,如图:
在这里插入图片描述
另一方面,SOAP收发数据时所使用的传输协议并不固定,凡是能够收发XML数据的协议均可使用。一般情况下使用的是HTTP或SMTP协议。可以说SOAP的诞生使得人们可以更加轻松地构建分布式计算环境了。

只有在像互联网那样的环境中,运行在不同机器中的不同应用程序相互联结,XML才会大有作为。只有一台独立的计算机,或者只在一家公司内部的话,使用XML格式存储数据反而体现不出优势,仅仅是文件的尺寸变大从而浪费存储空间罢了。

6.说明

本文为《计算机是怎样跑起来的》读书笔记,如有错误,请兄弟们指正,大家一起进步。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值