本节书摘来自华章出版社《语义网基础教程(原书第3版)》一 书中的第1章,第1.3节,作者:(希)Grigoris Antoniou(荷)Paul Groth(荷)Frank van Harmelen(荷)Rinke Hoekstra ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.3 一种分层方法
语义网的发展按步骤进行,每步都在一个层次之上建立另一个层次。这个方法的实用性论证是它更容易在小的步骤上达成一致,也就是说,如果有太多的目标,则很难让参与的每个人都同意。通常许多研究组研究不同的方向,思想的竞争是科学进步的主要驱动力。但是,从工程的角度则需要标准化。因此,如果绝大多数研究人员同意某些事情而反对另一些,稳固这些共识则是有意义的。这样,即使一些更有野心的研究成果会失败,但是至少有部分正面的结果。
一旦一个标准被确立,许多组织和公司将采用它而不是等待着观察最终是否有可替代的研究路线会成功。语义网的本质在于公司和单个用户必须构建工具、添加内容并使用这些内容。我们无法等到完整的语义网愿景变成熟—这可能还要10年时间来完全实现它(当然,是以今天的想象)。
在一个语义网层次上构建另一个层次的过程中,必须遵循两个原则。
向下兼容性。完全理解某一层次的agent应该能够解释和使用更低层次的信息。例如,理解OWL语义的agent能够充分利用RDF和RDF模式中的信息。
向上部分理解。设计应该使得完全理解某一层次的agent应该能够至少部分利用更高层次的信息。例如,一个仅理解RDF和RDF模式语义的agent可能能够通过忽略超出RDF和RDF模式的元素,部分地解释OWL中的知识。当然,并不是要求所有工具都提供这种功能性,关键在于允许这种选择。
虽然这些想法理论上很吸引人并且被作为指导原则来指导语义网的发展,实践上却存在困难,并且不得不采取某些妥协。这在第4章讨论RDF和OWL分层时会进一步说明。
图1-4展示了语义网的“分层蛋糕”,它描述了语义网设计和愿景的主要层次。在最底层我们可以发现XML,一种允许用户使用用户定义的词汇表来撰写结构化万维网文档的语言。XML特别适合于在万维网上发送文档。此外,用于XML中的URI可以按照它们的命名空间(namespace)聚类,在图中表示为NS。
RDF是一个基本数据模型,正如实体–联系模型一样,它表达了万维网对象(资源)的声明。RDF数据模型不依赖于XML,但是RDF有一个基于XML的语法。因此,在图1-4中,RDF位于XML层之上。
RDF模式提供了将万维网对象组织为层次结构的建模原语。重要的原语包括类和属性,子类和子属性联系,以及定义域和值域约束。RDF模式是基于RDF的。
RDF模式可以被认为是一种表达本体的基本语言。但是还需要一些更加强大的本体语言(ontology language),它们扩展RDF模式并且允许表达万维网对象间更加复杂的联系。逻辑层用于进一步增强本体语言并允许描述面向特定应用的声明式知识。
证明层(proof layer)包括了实际的演绎过程,以及使用(更低层次的)万维网语言来表达证明和验证证明。
最后,信任层(trust layer)将伴随使用数字签名(digital signature)和知识的其他类别出现,基于可信agent的推荐或者基于评分和证书中介及消费体。有时,“信任网”用于表示信任将被组织成与万维网本身一样的分布式的、混乱的方式。位于金字塔的最顶层,信任是一个高层且重要的概念:当用户对其操作(安全性)和提供的信息的质量信任时,万维网才能实现其所有潜力。
经典的分层蛋糕是语义网日程表上的主要驱动力,但是现在已经相当过时了。特别是本体词汇表层的许多替代者已经出现。另外规则语言已被定义在RDF之上,绕开了本体词汇表层,这特别适用于最近从丰富的语义结构向大规模(语义)数据处理的转变。因此这里给出的分层蛋糕主要是示例的目的,作为展现语义网历史观点的一种方式。