在PHP中运行XPath查询
XPath是一种可以对XML文档中的某一部分进行单独处理的一种语言,对于XSLT转换而言它尤其重要。XPath也可作为单独的工具管理应用程序中的XML数据,比如网络应用程序。
微软通过selectSingleNode() 和selectNodes()方法来提供的XPath功能,从而实现对DOM()节点和文档的操作。然而,PHP是通过程序中的环境(context)来实现XPath功能的。我将举例来说明如何利用PHP代码从XML文档中抽取不同的数据片断,并随后解释这些PHP代码是如何工作的。
在这个例子中,我使用了以下的XML数据。(注意:这些代码是在PHP 4.3.4、Windows XP和IIS 5.1条件下开发并运行成功的。)
<?xml version="1.0"?>
<x:rootxmlns:x="">
<x:row>
<x:dog
color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>
这个XML文档包含了一些元素(element)和属性(attribute),还有一个名域空间(namespace)的声明,都是一些基本的XML。在示例的PHP代码中,我们会从这个XML文档中得到多种的查询结果。
<?php
$sxml = '<?xml version="1.0"?>
<x:rootxmlns:x="">
<x:row>
<x:dog color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>';
$xml = domxml_open_mem($sxml);
$xpc = XPath_new_context($xml);
XPath_register_ns($xpc, "x", "");
$nodes = XPath_eval($xpc, "//x:row/x:dog[@color='yellow']/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . " ";
}
$nodes = XPath_eval($xpc, "//x:row/x:dog");
foreach ($nodes->nodeset as $node) {
print $xml->dump_node($node) . " ";
}
$nodes = XPath_eval($xpc, "//x:cat/child::text()|//x:dog[@color='white' or
@color='gray']/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . " ";
}
$xml->free();
?>
首先,创建一个局部变量来存储XML字符串,这一信息原本可以被传递并成为HTTP POST请求的一部分,然而,我要把它包含在代码中;下一步是要使用domxml_open_mem()来创建一个DOM文档,domxml_open_mem()可以从有效的XML字符串中在内存中创建一个DOM文档对象,它只有一个参数:XML字符串;另一种方法是将XML存储于一个单独的文件中,然后使用domxml_open_file()从文件中读取XML,它也只有一个参数:XML文件的文件名。
创建了DOM文档对象之后,就可以通过XPath_new_context()来创建这一对象的XPath环境了,它只需一个参数:当前的DOM文档对象。这一环境用于XPath表达式的运算,如果需要的话还可以用于注册名域空间。既然在XML中已经包括了一个名域空间,则使用XPath_register_ns()来注册名域空间,这样才能在XPath查询中使用前缀,XPath_register_ns()包括了三个参数:他们分别是XPath环境、前缀和名域空间。
现在可以运行XPath查询了,可以通过XPath_eval()来实现,它的第一参数是XPath的环境,第二参数是XPath表达式,XPath_eval()将返回一个DOM节点的数组,在我的代码中,我对节点集合进行单步调试,可以得到某些形式的输出。
在第一个XPath例子中,我抓取了所有‘color’属性等于‘yellow’,并且在x:row节点下的x:dog文本元素,在PHP中的XPath表达式和MSXML中的XPath有些细微的区别,我将‘/text()’部分包含在表达式中则只返回文本节点,而在MSXML中,你需要使用‘text’属性来访问文本节点,对返回的文本节点使用‘content’属性则可以取得文本节点的内容。
在第二个例子中,我抓取了在x:row节点下的x:dog元素,然而,这次我对DOM文档对象使用dump_node()方法来打印出具有适当节点的整个XML,dump_node()接受一个参数:需要转储内容的DOM节点。
在最后一个例子中,我抓取了所有‘color’属性等于’gray’的所有x:cat文本节点和x:dog文本节点,我再次对节点集合进行单步调试并打印出每个节点的内容,最后释放这个DOM文档对象。