本文适合初学者阅读,我觉得XML初学者可能会走近的误区:
1.XML是不是HTML的取代者
不是。写得好的html应该是一个well-formed的xml文档,其他方面最好不要把他们放在一个水平线上比较
2.XML是不是数据库的取代者
不是。
3.XML是不是...的取代者
都不是。
这个结论可能听上去很滑稽:XML是非常非常重要的东西,但它什么都取代不了。但这并不奇怪,有人把它比做ASCII标准,他们是一切一切的基础,但并没有(也不需要)取代什么。(但是就如同ASCII取代了一些没有成大器的字符集定义,XML也会取代你在应用中自己定义的一些数据传输规范,但没有什么特别主流的东西。)
刚开始学XML(或者说没开始学之前)的时候最爱问的一个问题肯定是:使用XML能给我带来什么好处?
我觉得从某种角度上说,使用XML有些象使用OO面向对象:
你可以用它,你也可以不用它。如果你的应用非常简单,用它不一定方便,没准儿用了效果还会更差。和其他实际东西比如数据库,MTS,WebServer比起来,它更像是一个概念,一种方法。项目越大,它的发挥余地越大,作用越大。一旦真正理解后,哪怕不用xmlparser,也不妨碍你使用这个概念,如同可以抛开特定语言使用OO。
好像更抽象,更没谱儿了吧。
那就随便举个例子。比如你本来想在bbs应用中的两个模块之间传一些数据:发言人、密码、标题、内容。使用四个参数是不太现实的,因为你随时可能要扩展功能,比如再加上个表情符号等等。不可能每次加个功能,就重新定义一遍函数。所以最简单的方法是把他们合并起来作为一个参数传递给函数。在有xml之前,你可能会使用分隔符:str="发言人=张三;密码=**;标题=abc;内容=xyz"。到server那边使用dictionary或collection或split等等方法把他们拆开。(当然可以自己定义对象啦,结构啦等等,但多数情况下还得是纯字符串--比如另一个模块不是自己开发的。)
这种传递字符串的方法有几个问题,总结成两个最大的方面就是:
1.正确的解析它很麻烦。(比如标题正好是“发言人=张三;”怎么办)
2.是平面的,没有层次型结构
你可以写些函数来解决这些问题,比如确保里面肯定有“发言人”,“密码”等等;再写些函数做一下字符转义,再写些函数制造出层次性的效果。够了!咱还是用XML吧。
在我目前浅显的认识里:XML是用来传递数据的;XML让这些数据有了结构--一个树型结构;xml有全套的操作这种结构的方法;xml规范(或者说的实际点,xmlparser)帮你确定你创建的字符串是合法的;xml规范(或者说的实际点,xmlparser)中有办法验证这个合法性;对于拿到这个字符串的servercomponent来说,可以用xml中现成的方法来操作它。
这就是xpath,pattern,类似于T-SQL语句(但记住xml是树型结构的)。XSLT使用xpath对xml进行转换(类似于DTS),其中一种特例是把XML转换成HTML输出。