说到Schema和DTD,相信对XML有所了解的人,都会自动化的想到验证两个字。是的,这两个技术就是用来验证XML的。那么为什么要对XML进行验证呢?这就要说到有效的XML了。
如果一个XML文档规定其文档类型和数据结构的DTD或者Schema,并且与之关联,并且校验正确,则此文档是有效的。那么有效和良好又是什么关系?
- 格式良好的XML文档,不一定是有效的XML文档。
- 有效的XML文档,则一定是格式良好的XML文档。
- 说明:在格式良好的基础上,再看是否满足企业的特殊要求。
明白了Schema和DTD的作用,那么到底它们又是什么?它们又有什么区别呢?不能互相替代吗?下面且听我细细说来吧。
先说说DTD。DTD(Document TypeDefinition,文档类型定义)是一套标记的语法规则。具体官方的解释就不说了,用我自己理解的话来说,DTD顾名思义,文档类型定义--定义XML文档的各种类型,例如元素啊,属性等的定义规则。这就是DTD。
再说说Schema。它是用一套预先规定的XML元素和属性创建的,也就是说XMLSchema是用来规定XML文档实例的结构和每个元素/属性的数据类型的。
看到这里,读者大概明白什么是Schema和DTD,可以是不是也不明白为什么他们俩这么相似还要两个都存在呢?请往下看吧~
正如我们看到的,Schema和DTD确实是非常相似的,但是也只是相似,它们还是有区别的。
区别一:
在此区别上,给XML Schema的使用带来许多好处:
- 使用Schema我们不再需要重新学习特殊的语法,节省了很多时间;
- 由于Schema本身也是一个XML,所以关于XML的工具,例如XML编辑工具,语法分析器等,Schema都可以直接应用;
- XML Schema理所当然的继承了XML的自描述性和可扩展性,这使得XML Schema 更具有可读性和灵活性;
- DTD是用来验证XML的,但是DTD本身的合法性却缺少较好的验证机制,而Schema在此不同,它拥有良好的合法性验证机制.
区别二:
对于开发者而言,这是两者特别显著的一个区别了.
1.XML DTD提供的数据类型只有NMTOKEN、NMTOKENS等十种内置(built-in)数据类型.这些数据类型显然无法满足文档的可理解性和数据交换的需要.
2.XML Schema则不同,它内置了三十七种数据类型,如int,short,double等常用的数据类型,并通过将数据类型表示为由value space、lexicalspace和facet三部分组成的三元组而获得更大的灵活性。
这里需要提一下,XML Schema之所以可以达到这样的灵活性,主要来自于对用户自定义类型的支持.XML Schema提供两种方式来实现数据类型的定义:
1)简单类型定义(simpleType),即在XML Schema内置的数据类型基础上或其它由XML Schema内置的数据类型继承或定义所得到的简单的数据类型(simpleType)基础上,通过restriction,list或者 union方式定义新的数据类型。
2)复合类型定义(complexType),该方法提供了一种功能强大的复杂数据类型定义机制,可以实现包括结构描述在内的复杂的数据类型。
其他区别:
综上可知,DTD和Schema的区别还是比较显著的,但是至于Schema能否取代DTD呢?我觉得正如"存在即合理",DTD虽然没有Schema那么强的表现力,但是它让有它的适用范围.
我觉得这句话来最后总结两者的恩恩怨怨很合适:作为一种强有力的标准,XML Schema作为XML模式的主流已经成为一种趋势;但作为一种最简单的XML模式,XML DTD也还将会在一段时间内发挥它应有的作用。你觉得呢?