图形数据标准化

图形数据标准化

AWS,Google,Neo4j,Oracle。这些只是在W3C关于图形数据的Web标准化的W3C研讨会上代表的一些供应商,内容必然会促进数据管理中最热门的部分:Graph的采用。

让许多供应商互相交谈,更不用说团结一致,这并非易事。增加学者和研究人员并不一定会使事情变得容易。现在,尝试将零散的社区和长期存在的未解决问题添加到组合中,将了解为什么到目前为止尚未实现图形数据标准化的图片。 

即将彻底改变一切的AI独角兽芯片在其核心具有计算图

但是,这似乎即将改变,这对每个人来说都是个好消息。在过去的几年中,一直密切关注图数据库的兴起。恒星似乎终于对齐了图表,世界的Gartners和Forresters也都在关注这一点。

纳入Gartner的炒作周期之后Gartner还将Graph列为2019年十大数据和分析技术趋势中的第五名。图在建模多个域方面大放异彩,并且是利用连接数据的最佳选择。那么,为什么要花这么长时间才能成为主流呢?要引述研究员ZDNet撰稿人,分析师Tony贝尔: 

“我一直觉得图形更适合嵌入到引擎,因为它是一个奇怪的新数据库,没有事实标准或其他标准。开始改变自己的看法-每个主要数据平台提供商现在都有图形数据库或API /引擎。”

标准-该技术一直在进步,以至于现在可以大规模使用图形。但是,要想在现有的市场中分得一杯without而又无法进行互操作,可能会充满挑战。NoSQL人群,最终主要采用SQL。这就是W3C进来的地方。

重新讨论属性图和RDF

W3C Web的标准化图形数据,柏林举办了一次研讨会,以获得尽可能多的图形社区,共同讨论和汇聚在可能的标准化努力的目标。该研讨会主要由Neo4j驱动和赞助。其他赞助商是Oracle,Ontotext和ArangoDB。

从大数据到AI:现在在哪里,前进的方向是什么?

根据DB-Engines索引,Neo4j是图形数据库的市场领导者。已经与Neo4j的首席执行官Emil Eifrem进行了多次对话,就在W3C研讨会之前,Eifrem坚定地进行了一次对话:标准化是Neo4j的重中之重。
图形数据库格局已经分散了,属性图和RDF代表了建模,存储和查询数据的不同方法,没有标准的互操作性方法。尽管RDF是标准化的,但特性图却不是
这不利于Graph数据库的采用,并且专家,标准组织和供应商都意识到了这一点。W3C图形数据Web标准化研讨会在柏林召集了图形数据库专家来解决此问题。 

RDF已经存在了大约20年,最初是由研究和学术界推动的。RDF由WWW发明家Tim Berners Lee爵士提出的语义网构想发起,具有大量堆栈。该堆栈包含诸如推理和规则之类的东西,并且已经有稳定的标准存在一段时间了,其中包括用于序列化,模式和查询的标准。
然而,问题是实用主义并不总是那里的核心问题。另外,用于RDF的工具很少而且并不总是易于使用。以JSON-LD为例。想出一种标准的方法来序列化基于JSON的RDF,这是Web开发人员最流行的格式,这似乎很容易。
JSON-LD和schema.org的结合可能在扩展RDF的使用方面做得更多。仅仅让Google和其他搜索引擎采用它就导致了一系列用例。但是,在RDF社区中,JSON-LD当时引起了极大争议。这不是RDF社区面临的最后一个争议,但似乎JSON-LD的成功可能有一些可借鉴之处。

属性图已经存在了大约10年,并且受到了行业的推动。因此,可以说它们是RDF的反面镜像:实用主义规则,工具丰富且易于使用,扩展和社区建设是当务之急,但标准化只是此后的事。

大多数属性图解决方案没有模式,或者具有非常基本的模式。只是将数据输入和输出属性图解决方案是一项耐心和即兴的练习-以CSV格式表示图形结构,并将其映射到解决方案之间。属性图没有标准的查询语言。此时,属性图也没有抽象模型或语义之类的东西。

引力波矩 

现在,这些都不是无法解决的。对于属性图世界,在某种常识序列化格式上达成共识,对现有查询语言进行综合,并研究将使模式和语义定义成为可能的所有属性图模型,似乎都是要采取的合理步骤。那么,好消息是:看来这正是议程中的内容,因此可以预期将执行这些步骤。 

 Confluent显示开源,范式转换,云和商业成功都可以共存

那么,对于所有已经存在的RDF世界来说,什么是紧要关头?W3C讲习班中用来描述状态的一个明确指示的隐喻是一座桥。毕竟,搭建桥梁是这次活动的主题。在属性图之间建立桥梁是一回事,但是在属性图和RDF之间建立桥梁又如何呢?

尽管属性图在构建通往RDF世界的桥梁的支柱方面有工作要做,但在RDF中,支柱主要存在于其中,除了一件事:修正。如果不喜欢RDF,那么可能从来没有听说过Reification,也不是很在乎。但这是构建到属性图世界的桥梁的关键,而且似乎RDF终于接近解决这个问题了。

 图形数据标准化

 

 参加有关图形标准化的W3C研讨会是一个有趣的经历。

修正是一种向RDF图边缘添加属性的机制,从而使它们可以直接转换为属性图。尽管这是可能的,但到目前为止,尚无统一的标准来达成此目的。RDF *是关于如何执行此操作的建议,在RDF世界中正受到关注。
W3C研讨会的成果之一是几乎一致的想法,使之成为W3C规范。这种技术性或某些人称之为“红鲱鱼”,已经使RDF社区停滞了很长时间。

柯林斯(Collins)在他的《人工智能》一书中对人们在社会上建构意义的方式进行了描述。作为案例研究,他使用了他所嵌入的引力波实验证据的趋同。 

这只是一张图,在现实世界中掀起波澜

RDF *是否可以像RDF一样具有关键性,以及像引力波对物理学一样,可以大范围绘制图形。潜力和动力肯定存在,W3C研讨会的人员似乎已经承诺继续致力于这些支柱和桥梁。 

开始重新技能革命:工作的未来趋势和有关软技能的软数据

然而,与此同时,图形在现实世界中正在风起云涌。最后,正如AWS Neptune的Brad Bebee在他的主题演讲中所说的那样,它只是一张图表。用户并不真正在乎底层的技术。他们正赶上“图形让疯狂地集成数据”这一事实。 

Neptune是来自AWS的基于云的图形数据库,它使用户可以使用RDF和属性图,并将这些桥安装在适当位置将极大地受益。正如Bebee指出的那样,根据最近一次AWS re:Invent会议上的社交媒体调查,海王星已成为2018年最受欢迎的AWS新产品之一。这可以说明问题,但这并不是图形数据库世界中的所有新事物。 

 图形数据标准化

 

 图在现实世界中正在获得引力,并在掀起波澜。

Neo4j的一轮融资:8000万美元。在与Eifrem讨论如何实现此目标的路线图时,强调了三个优先事项:标准化,云计算和扩展。已经详细说明了标准化,因此只需要补充一点,那就是在ISO和正在进行的SQL工作方面还有其他桥梁。

但是云计算和扩大规模又如何呢?Neo4j目前不提供托管云版本。由于这将成为任何数据库解决方案,Neo4j致力于此工作。Eifrem表示,基于Kubernetes的Neo4j托管云版本目前处于私有测试阶段,反馈很好,并且即将release。
Neo4j将在未来一段时间内大量招聘员工。做这件事并扩大公司规模的过程虽然很平淡无奇,但却非常需要努力,这正是Eifrem忙碌的原因。因此,暂时没有那么多闪亮的新玩具可供展示,但Eifrem暗示不久将有更多这种新玩具出现。但是与此同时,其他供应商也在加紧规划。
例如,RDF供应商增加了对属性图的支持。AWS已经有了它,Cambridge SemanticsStardog也都添加了它。另外,多模型支持以及JSON的组成部分已成为许多供应商的关键功能。JSON-LD敞开了大门,在过去的几个月中,AllegroGraphOntotext等供应商也增加了对JSON的支持。将很快对这个领域进行更深入的分析

 

上一篇:知识图谱的个人总结


下一篇:论文阅读:From SHIQ and RDF to OWL: the making of a Web Ontology Language