[NLP] 语义网络与知识图谱入门(一)

语义网络与知识图谱入门(一)

RDF/XML

本体:一种形式化的对于共享概念体系明确而又详细的说明。就是指一种抽象的模型,可以用来描述对象类型、属性以及关系类型所构成的世界。

RDF/XML主要讲的就是如何用XML的方式来表示RDF的图。

[NLP] 语义网络与知识图谱入门(一)

椭圆表示节点,矩形表示文本,弧表示谓语。

节点描述

<rdf:Description rdf:about="A"></rdf:Description>

一个节点本身需要被rdf:Description来定义,通过rdf:about来说明资源uri。

前面rdf是空间名字,固有空间默认为rdf空间。

属性描述

如何描述A的属性d的值为D呢?

属性描述
<rdf:Description rdf:about="A">
    <d>D</d>
</rdf:Description>

简写
<rdf:Description rdf:about="A" d="D"></rdf:Description>

路径描述

如何描述A到B的路径呢?

可以通过定义rdf:nodeId的方式指定唯一的nodeId,也可以通过rdf:parseType为Resouce来指定空节点。

属性描述,注意这里的B也是个节点,所以也需要Description
<rdf:Description rdf:about="A">
    <a rdf:nodeId="abc"></a>
</rdf:Description>
<rdf:Description rdf:nodeId="abc">
    <b>
        <rdf:Description rdf:about="B" ></rdf:Description>
    </b>
</rdf:Description>

不单独写空节点,即用resource
<rdf:Description rdf:about="A">
    <a rdf:parseType="Resource">
        <b>
            <rdf:Description rdf:about="B" ></rdf:Description>
        </b>
    </a>
</rdf:Description>

文本表示

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
  xmlns:ex="http://purl.org/dc/elements/1.1/">
    <rdf:Description rdf:about="http://example.com">
        <ex:prop rdf:parseType="Literal" xmlns:a="http://example.org/a#">
            123
        </ex:prop>
    </rdf:Description>
</rdf:RDF>

xmlns即xml namespace,定义一个命令空间。

使用语法: xmlns:namespace-prefix="namespaceURI"。

这里定义一个名字为a的命令空间

可以看到解析后的结果为:

Number Subject Predicate Object
1 http://example.com](http://example.com/) http://purl.org/dc/elements/1.1/prop) "123"^^http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral

解析网址:https://www.w3.org/RDF/Validator/rdfval

通过解析可以看出来将prop指向的内容解析成了文本类型,即通过指定rdf:parseType="Literal"来实现。谓词rdf:parseType="Literal",指明节点的内容是普通文本,解释器不需要对其进行解释。

数据类型

可以使用rdf:datatype指定文本的数据类型

<rdf:RDF>
    <rdf:Description rdf:about="http://example.com">
        <a rdf:datatype="http://www.w3.org/2001/XMLSchema#int">
        123
        </a>
    </rdf:Description>
</rdf:RDF>

同样的,也有string,date,decimal等数据类型可以在上面的datatype中指定。

RDF Schema (RDFS)

RDFS的全称为RDF Schema,RDF Schema 中的类与面向对象编程语言中的类非常相似。这就使得资源能够作为类的实例和类的子类来被定义。

<rdf:RDF
xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base=  "http://www.animals.fake/animals#">

<rdf:Description rdf:ID="animal">
  <rdf:type 
   rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
</rdf:Description>

<rdf:Description rdf:ID="horse">
  <rdf:type
   rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
  <rdfs:subClassOf rdf:resource="#animal"/>
</rdf:Description>

</rdf:RDF>

rdf:type
用来表示主语是谓语的一个实例,主语是一个资源,谓语是一个类 ,上面例子中说明animal是class的实例,horse也是class的实例。

rdfs:subClassOf

用来表示主语是谓语的子类,主语和谓语都是一个类 。上面例子中表明horse是animal的子类。

rdfs:subPropertyOf

用来表示主语是谓语的子属性,主语和谓语都是属性

rdfs:domain

用来表示属性的定义域

rdfs:range

用来表示值域

另外,一切所有皆资源(resource):所有类(class)都是资源,所有属性(property)都是资源,所有literal都是资源。

容器

Open Lists

open lists为课题添加新元素的容器。

rdf:Seq表示一个规定为有序的值的列表(比如一个字母顺序的排序),可以包含重复值。

rdf:Bag表示一个规定为无序的值的列表,可以包含重复值。

rdf:Alt表示一个可替换的值的列表(用户仅可选择这些值的其中之一)。

<rdf:RDF>
    <rdf:Description rdf:about="http://a.com">
        <a>
            <rdf:Alt>
                 <rdf:li>CD</rdf:li>
                 <rdf:li>Record</rdf:li>
                 <rdf:li>Tape</rdf:li>
           </rdf:Alt>
        </a>
    </rdf:Description>
</rdf:RDF>

rdf:li,解释器在解释时,将自动生成编号。

Closed Lists

closed lists为不可以添加元素的容器,其成为collections。通过rdf:parseType="collections"可以将宾语视为closed lists。

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
xmlns:cd="http://recshop.fake/cd#">

<rdf:Description
rdf:about="http://recshop.fake/cd/Beatles">
<cd:artist rdf:parseType="Collection">
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/George"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/John"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Paul"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Ringo"/>
</cd:artist>
</rdf:Description>

</rdf:RDF>

Turtle语法

turtle用三元组表示,每个句子后面一个.表示句子结束。

前缀

@prefix book: <http://aa.com> .
@prefix ex: <http://axx.com> .

通过@prefix来指定前缀,这样就可以在后面用这个前缀了。

book:uri ex:a "aaa".
上一篇:java – 使用Virtuoso设置RDF本体


下一篇:java – 将多个RDF文档合并为一个