GitHub开源史上最大规模中文知识图谱

2021-12-15 09:35:10

近日，一直致力于知识图谱研究的 OwnThink 平台在 Github 上开源了史上最大规模 1.4 亿中文知识图谱，其中数据是以（实体、属性、值），（实体、关系、实体）混合的形式组织，数据格式采用 csv 格式。

到目前为止，OwnThink 项目开放了对话机器人、知识图谱、语义理解、自然语言处理工具。知识图谱融合了两千五百多万的实体，拥有亿级别的实体属性关系，机器人采用了基于知识图谱的语义感知与理解，致力于最强认知大脑。自然语言处理工具包的功能有：中文分词、词性标注、命名实体识别、关键词提取、文本摘要、新词发现、情感分析等。

在 OwnThink 平台首页上滚动着各种关键词，用户也可输入自己想要查询的知识，然后就可以得出相应的知识图谱。

OwnThink 知识图谱还可以应用于机器人问答系统、知识推荐等等。下图为知识图谱在机器人上的应用。

GitHub开源史上最大规模中文知识图谱

OwnThink支持在线API调用，感兴趣的小伙伴可以调测使用，使用Python进行对话机器人简单调用测试。

import json
import requests
sess = requests.get('https://api.ownthink.com/bot?spoken=中国')
answer = sess.text
answer = json.loads(answer)
print(answer)

效果如下：

GitHub开源史上最大规模中文知识图谱

GitHub地址：https://github.com/ownthink/KnowledgeGraphData

OwnThink网站地址：https://www.ownthink.com/

码农公寓

相关文章