Atitit 知识图谱解决方案:提供完整知识体系架构的搜索与知识结果overview

Atitit 知识图谱解决方案:提供完整知识体系架构的搜索与知识结果overview

 

知识图谱的表示和在搜索中的展1

提升Google搜索效果3

1、找到最想要的信息。3

2、提供最全面的摘要。4

3、让搜索更有深度和广度。4

 

互联网正从仅包含网页和网页之间超链接的文档万维网(Document Web)转变成包含大量描述各种实体和实体之间丰富关系的数据万维网(Data Web)。在这个背景下,Google、百度和搜狗等搜索引擎公司纷纷以此为基础构建知识图谱,分别为Knowledge Graph、知心和知立方,来改进搜索质量,从而拉开了语义搜索的序幕。下面我将从以下几个方面来介绍知识图谱:知识图谱的表示和在搜索中的展现形式,知识图谱的构建和知识图谱在搜索中的应用等,从而让大家有机会了解其内部的技术实现和各种挑战。

知识图谱的表示和在搜索中的展

 

方法的是清晰的,没有什么秘密。楼上各位都说的很清楚了:实体提取,关系提取,图谱存储和检索。

实现一个大规模中文知识图谱主要有两部分,以“美人鱼的导演是谁”为例:

1. 建知识库。爬百度百科,解析网页,实体对齐。知识库可以用RDF表示:三元组(美人鱼,导演,周星驰),和对应的schema(movie, movie_director, person)。存储方式有多种:可以Neo4j、MySQL,也可以自定义。抓取的网站越多,歧义消除/指代消解之类的事越多,找质量好的网站可以省很多事。半结构化的网页到结构化的数据也是一大坑。

2. 查询理解。语义分析“美人鱼的导演是谁” ,得到句法树,生成检索语句(与对应的存储方式对应:SparQL-Neo4j / MySQL-SQL),检索知识库得到结果 “周星驰”。

作者:满地大松果

Google在其官方博客中宣称:为了让用户能够更快更简单的发现新的信息和知识,Google搜索将发布“知识图谱”(Knowledge Graph)——可以将搜索结果进行知识系统化,任何一个关键词都能获得完整的知识体系。 比如搜索“Amazon”(亚马逊河),一般的搜索结果会给出和Amazon最相关的信息。比如Amazon网站,因为网上关于它的信息最多,但Amazon并不仅仅是一个网站,它还是全球流量最大的Amazon河流。如果在追溯历史,它可能还是希腊女战士一族的代称。而这些结果未来都会在Google搜索的“知识图谱”中展现出来。

让用户能够更快更简单的发现新的信息和知识,Google搜索将发布“知识图谱”(Knowledge Graph)——可以将搜索结果进行知识系统化,任何一个关键词都能获得完整的知识体系。

1. 找到正确的结果。由于一个关键词可能代表多重含义,所以知识图谱会将最全面的信息展现出来,让用户找到自己最想要的那种含义。

1.

最好的总结。有了知识图谱,Google可以更好的理解用户搜索的信息,并总结处相关的内容和主题。当你搜“玛丽·居里”时,你不仅可以获得这个关键词的所有相关内容,还能获得居里夫人的详细生平介绍。

2.

3.

更深、更广。由于“知识图谱”会给出搜索结果的完整知识体系,所以用户往往会发现很多不知道的东西(知识)。当你搜索一个即将去旅行的地方时,可能你会发现一个以此命名的餐馆,甚至还可能发现还有一本小说就叫这个名字,并且已经改编成了同名电影。

4.

Google的“知识图谱”不仅仅会从Freebase、*或全球概览中获得专业的信息,同时还通过大规模的信息搜索分析来提高搜索结果的深度和广度。现在Google数据库中包含超过5亿个事物,不同事物之间的关系超过35亿条。同时人们搜索的越多,Google获得的信息也就越多越全面,整个知识图谱也就会达到更好的效果。

目前Google的知识图谱会先从英文搜索开始,未来会向手机平板等移动设备和更多的语言扩展。欲了解更多信息,请移步

提升Google搜索效果

编辑

Knowledge Graph从以下三方面提升Google搜索效果:

1、找到最想要的信息。

语言可能是模棱两可的 —— 一个搜索请求可能代表多重含义,Knowledge Graph会将信息全面展现出来,让用户找到自己最想要的那种含义。现在,Google能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。

2、提供最全面的摘要。

有了Knowledge Graph,Google可以更好的理解用户搜索的信息,并总结出与搜索话题相关的内容。例如,当用户搜索“玛丽·居里”时,不仅可看到居里夫人的生平信息,还能获得关于其教育背景和科学发现方面的详细介绍。此外,Knowledge Graph也会帮助用户了解事物之间的关系。

3、让搜索更有深度和广度。

由于Knowledge Graph构建了一个与搜索结果相关的完整的知识体系,所以用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。

所谓知识图谱听起来很高大上号称给计算机装上了大脑…其实无非就是从各种结构化/半结构化/非结构化数据中抽取实体/实体属性/实体之间的关系,构成一张图,这张图能够反映真实世界的相关信息,因为真实的世界在人类的认知当中就是由实体、属性和实体间的关系构成的

获取这些东西的最大挑战无非就是实体识别、消歧(重名,别名)、实体关系挖掘等,这些归根到底都属于nlp的问题

知识图谱_百度百科.html

Google发布“知识图谱”:为用户提供有完整知识体系的搜索结果.html

(1 封私信 _ 2 条消息) 中文知识图谱构建思路是什么? - 知乎.html

作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 )

汉字名:艾提拉(艾龙),   EMAIL:1466519819@qq.com

转载请注明来源: http://www.cnblogs.com/attilax/

Atiend

上一篇:Redis Sentinel高可用架构


下一篇:transition的唧唧歪歪