XML入门教程：XML CDATA

位置：海鸟网 > IT > XML >

微博文章来源:网络整理本站编辑:兰特

所有XML文档中的文本均会被解析器解析。

只有CDATA区段（CDATA section）中的文本会被解析器忽略。

Parsed Data

XML解析器通常会解析XML文档中所有的文本。

当某个XML元素被解析时，其标签之间的文本也会被解析：

<message>此文本也会被解析</message>

解析器之所以这么做是因为XML元素可包含其他的元素，就像这个例子中，其中的<name>元素包含着另外的两个元素(first 和 last)：

<name><first>Bill</first><last>Gates</last></name>

而解析器会把它分解为像这样的子元素：

以下为引用的内容：
<name>
<first>Bill</first>
<last>Gates</last>
</name>

转义字符

非法的XML字符必须被替换为实体引用（entity reference）。

假如您在XML文档中放置了一个字符，例如"<"，那么这个文档会产生一个错误，这是因为解析器会把它解释为新元素的开始。因此你不能这样写：

<message>if salary < 1000 then</message>

为了避免这个错误，您需要把字符"<"替换为实体引用，就像这样：

<message>if salary < 1000 then</message>

在XML中有5个预定义的实体引用：

< < 小于

> > 大于

& & 和号

' ' 省略号

" " 引号

注释：严格地讲，在XML中仅有字符"<"和"&"是非法的。省略号、引号和大于号是合法的，但是把它们替换为实体引用是个好的习惯。

CDATA

CDATA内部的所有东西都会被解析器忽略。

假如您的文本中包含了大量的"<"和"&"字符 - 就像编程代码中经常出现的情况一样 - 那么这个XML元素就可以被定义为一个CDATA部分。

CDATA区段开始于"<![CDATA["，结束于"]]>"：

以下为引用的内容：
<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
   {
   return 1
   }
else
   {
   return 0
   }
}
]]>
</script>

在上面的例子中，在CDATA区段中的所有东西都会被解析器忽略。

关于CDATA区段的注释：

CDATA区段不能包含字符串"]]>"，所以，CDATA区段的嵌入是不被允许的。

同时也需要确保在"]]>"字符串中没有空格或折行。