XML:数据存储与交换的理想解决方案
1. 计算机信息存储与交换的困境
自计算机诞生以来,信息的存储和交换一直是个难题。文件本质上可分为两类:基本文本文件和二进制文件。
1.1 文本文件的优缺点
文本文件兼容性最佳,采用 ASCII 系统的标准 8 位字符存储信息。从早期的 Sinclair ZX81、PDP - 11/73、Commodore 64、Atari ST 到现代的 PC、Mac 和 Unix 工作站,都能读写 ASCII 数据。然而,ASCII 也存在问题,不同机器使用不同字符进行行终止,但这些问题并非无法克服。
不过,ASCII 作为存储格式,在处理字母、数字和基本标点之外的内容时存在局限。它本质上只能表示 128 种不同字符,包括主要的大小写字母、数字和基本符号,无法表示带重音的字符和其他货币符号,甚至连重音符号都无法使用,也就无法在文本中标记,让 Word 等程序理解其含义。
此外,纯文本是一种无格式、无结构的信息存储方式。虽然有逗号分隔值(CSV)和制表符分隔字段(TDF)等解决方案,但它们仅适用于表格数据。
1.2 专有二进制格式的问题
若要存储使用粗体、斜体、不同字体、特殊字符并包含图像、电影和声音的标记文档,通常会采用专有二进制格式。这种格式可使用 8 位全宽字符,能自由格式化和结构化文档,但缺点是只有特定应用程序才能读取。
当需要与他人交换文档时,问题就出现了。如果通过电子邮件传输,可能需要将其编码为基于 ASCII 的格式(通常由电子邮件软件自动处理),然后再解码回二进制格式。接收者还需要有创建该文档的应用程序副本,或者至少是能导入或读取该二
超级会员免费看
订阅专栏 解锁全文
3387

被折叠的 条评论
为什么被折叠?



