XML CDATA

XML文档解析详解

最新推荐文章于 2023-10-10 09:43:01 发布

最新推荐文章于 2023-10-10 09:43:01 发布 · 132 阅读

本文深入探讨了XML文档的解析过程，包括解析器如何处理文本、CDATA区段的使用及注意事项等核心内容。此外，还详细介绍了如何正确处理非法字符以避免解析错误。

Previous Page Next Page 所有 XML 文档中的文本均会被解析器解析。只有 CDATA 区段（CDATA section）中的文本会被解析器忽略。 Parsed Data XML 解析器通常会解析 XML 文档中所有的文本。当某个 XML 元素被解析时，其标签之间的文本也会被解析： <message>此文本也会被解析</message> 解析器之所以这么做是因为 XML 元素可包含其他元素，就像这个例子中，其中的 <name> 元素包含着另外的两个元素(first 和 last)： <name><first>Bill</first><last>Gates</last></name> 而解析器会把它分解为像这样的子元素： <name><first>Bill</first><last>Gates</last></name> 转义字符非法的 XML 字符必须被替换为实体引用（entity reference）。假如您在 XML 文档中放置了一个类似 "if salary 为了避免此类错误，需要把字符 "if salary < 1000 then 在 XML 中有 5 个预定义的实体引用： < 大于 & & 和号 ' ' 省略号 " " 引号注释：严格地讲，在 XML 中仅有字符 ""：在上面的例子中，在 CDATA 区段中的所有东西都会被解析器忽略。关于 CDATA 区段的注释： CDATA 区段不能包含字符串 "]]>"，所以，CDATA 区段的嵌套是不被允许的。同时也需要确保在 "]]>" 字符串中没有空格或折行。 </name>