位置:海鸟网 > IT > XML >

XML入门教程:XPath

XPath是一种用来从文档树中选择节点和节点集的语言。从XPath的角度来看,共有七种节点:

  • 根节点

  • 元素节点

  • 属性节点

  • 文本节点

  • 注释节点

  • 处理指令节点

  • 名称空间节点

  • CDATA部份,实体引用和文档类型声明不包括在内,XPath在所有这些项都并入文档之后才起作用。根节点和根元素是不同的两个概念,根节点包含整篇文档,包括根元素。

    本文由建站学()转载发布!转载请注明出处,谢谢!

    1. 匹配模式

    匹配模板的通用模式

    Table 6.1. 

    模式 描述

    match="E" 匹配元素E

    match="*" 匹配任意元素

    match="E|F" 匹配元素E和F

    match="E/F" 匹配以E为父元素的元素F

    match="E//F" 匹配以E为根元素的元素F

    match="/" 匹配根节点

    match="text()" 匹配文本节点

    match="comment()" 匹配注释节点

    match="processing-instruction()" 匹配处理指令

    match="node()" 匹配除属性节点和根节点外的节点

    match="id(test)" 匹配具有唯一ID test的元素

    match="E[@CLASS="foo"] 匹配元素E,其类属性为foo

    match="E[F]" 匹配元素包含有F元素的E元素

    2. XPath轴

    XPath提供了选择节点的机制,两个较有用的是轴选择和谓语选择,轴指定上下文节点和要选择的节点的关系。共有十三种轴,最常用的有四种,分别是子轴(child)、属性轴(attribute)、自已(self)、双亲(parent)。

    Table 6.2. XPath轴描述

    轴 描述

    child 包含当前节点的儿子

    descendent 包含当前节点的后代,后代不包含属性(attribute)或名称域(namespace)节点

    parent 包含当前节点的父亲

    ancestor 包含当前节点的祖先,祖先总是包含根节点

    following-sibling 包含当前节点随后的所有节点树,但不包含attribute或namespace节点

    preceding-sibling 包含当前节点之前的所有节点树,但不包含attribute或namespace节点

    following 包含当前节点随后的所有节点,following轴排除了当前节点的后代和attribute或namespace节点

    preceding 包含当前节点之前的所有节点,following轴排除了当前节点的后代和attribute或namespace节点

    attribute 包含当前节点的所有属性

    namespace 包含当前节点的所有namespace节点

    self 只包含当前节点

    descendent-or-self 包含当前节点和当前节点的后代

    ancestor-or-self 包含当前节点和当前节点的祖先

    3. 谓词

    XPath表达式可以匹配多个节点,如需对匹配的节点进行进一步的筛选,可以使用谓词。

    Table 6.3. 选择节点常用谓词

    谓词 描述

    select="E" 选择是当前节点的孩子的E元素

    select="" 选择当前节点的孩子的所有元素

    select="text()" 选择当前节点的文本节点孩子

    select="@name" 选择当前节点的name属性

    select="@*" 选择当前节点的所有属性

    select="E[1]" 选择当前节点的孩子的第一个E元素

    select="E[last()]" 选择当前节点的孩子的最后一个E元素

    select="*/E" 选择当前节点的孙了的所有E元素

    select="E//F" 选择从当前节点的孩子的E元素派生而来的元素F

    select="//" 选择根元素

    select="//E" 选择从根节点派生而来的E元素

    select="//E/F" 选择所有是从根节点派生而来的E元素的孩子的F元素

    select="." 选择当前节点

    select=".//E" 选择从当前节点派生而来的所有E元素

    select=".." 选择当前节点的父节点

    select="../@name" 选择当前节点的父节点的name属性

    select="E[@name='foo']" 选择所有是当前节点的孩子,并且其name属性具有foo值的E属性,除等号外,还可用<,>,<=,>=和!=

    select="E[@foo and @bar]" 选择所有包含foo和bar属性的E元素

    home/person/@id这种定位路径的写法叫简写定位路径,该写法简洁,容易理解,是XSLT匹配模式中最常用的写法。还有一种称为非简写定位路径的写法,它把节点测试和轴结合在一起,如child::home/child::person/attribute::id。该写法在实际使用中不常用,但它具有非常重要的性能因此有必要了解。

    4. XPath表达式

    位置路径是XPath的一个最常用的表达式,用以标识XML文档的节点集。除此之上,XPath表达式还可返回数字、布尔和字符串。非节点集的XPath表达式不能用于xsl:template元素的match属性中。它们用于xsl:value-of元素的select属性值或用于位置路径的谓词中。

    每个XPath位置路径可分为一步名多步,每步以“/”号分隔,如:

    room[\@name=$root]/date[year=$year and month=$month]/meeting

    上下文节点即当前正在处理的节点,也就是位置路径定位的当前节点。上下文在XPath表达式计算前被创建,由XSLT处理器创建。处理每一步后,上下文都会改变。

    位置路径中的步可分为三部份:轴(axis)、节点测试(note test)和谓词(predicate),它的写法如下:

    axis::note-test[predicate]

    轴和节点测试之间用“::”分开,每个谓词由括号[]括起来。

    要设计好一个位置路径,需确保在每一步选择最少的节点,使用最严格的轴,用最严格的节点测试。避免使用谓词,因为由轴和节点测试选择的节点集的每个节点都会用作谓词的上下文节点。对于位置路径的三步,最节省的是节点测试。

    XPath中的所有数字都是8个字节的IEEE754浮点双精度类型,与java的double类型相同。可表示正无穷大、负无穷大和NaN(零除零)值。支持五种运算符,分别是加(+)、减(-)、乘(*)、除(div)、取余(mod)。

    XPath中的字符串是Unicode字符,用单引号或双引号定界。可以使用=和!=对字符进行比较,也可用<,>,<=,>关系运算符,但比较的两个字符必须是数字,否则比较结果没有意义。

    XPath中的布尔值常用于位置路径的谓词中,如/person[name="debian"]。布尔值还常用于xsl:if和xsl:when元素的test属性中。如:

    <xsl:template match="home"> <xsl:if test = ".='debian' or .='redhat'"> <xsl:value-of select = "." /> </xsl:if></xsl:template>

    5. XPath函数

    XPath还提供很多函数,用于表达式和谓词。XPath函数的返回值有四种类型,分别是:

  • 布尔值,如:true()返回ture(真),false()返回false(假),not()对布尔值取反。

  • 数字,如:number()把任意类型转化数字,celing()返回大于或等于参数的最小整数。

  • 节点集,如:position()返回当有节点在上下节点列表中的位置,count()可统计节点数。

  • 字符串,如:string()转化任意类型为字符串,string-length()返回字符串长度。