1. XML文件格式简述
XML(Extensible Markup Language)中文意思为可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言
通常情况下XML 文档的第一行是一个 XML 声明,这是文件的可选部分,它将文件识别为 XML 文件,有助于工具和人类识别 XML(不会误认为是 SGML 或其他标记)。可以将这个声明简单地写成 <?xml?>
,或包含 XML 版本(<?xml version="1.0"?>
),甚至包含字符编码,比如针对 Unicode 的 <?xmlversion="1.0" encoding="utf-8"?>
XML文件核心区域主要包括根元素、命名元素、嵌套元素以及元素的属性,本文中使用的文件内容如下所示
<?xml version="1.0"encoding="utf-8" standalone="yes" ?>
<root>
<Item Value="这是一个测试"/>
<ItemValue="This is a test"/>
</root>
2. 文件编码和内容编码
用UtraEdit创建新文件,内容填上如上所示的内容,并保存文件为类型为xml的文件。默认文件格式为Unicode。xml文件格式支持如下的几种类型
2.1 以ANSI方式存储
如果文件格式为ANSI/ASCII,则需要将Unicode转化成为ANSI方式以及指定为中文GBK字符集。