开源问答系统调研

开源问答系统调研

各类关于CQA,KBQA,KGQA问答系统的研究层出不穷,本文面向中文智能问答系统在工业界落地的需求,调研了GIthub上几个具有借鉴意义的问答系统项目。

1. QABasedOnMedicaKnowledgeGraph 3.5k stars

https://github.com/liuhuanyong/QASystemOnMedicalKG
基于知识图谱的问答系统,医疗领域。
数据库:neo4j
规模:7类实体共4.4万个,约30万条关系,18种问答意图。

2. haystack: 2.7k stars

https://github.com/deepset-ai/haystack
端到端的问答框架,实现基于文档数据的语义搜索和问答。
可整合Huggingface’s Transformers, Elasticsearch, Milvus等工具。
可使用知识库进行查询(使用语义网标准,如RDF、SPARQL)。见文档

3. KBQA-BERT: 998 stars

https://github.com/WenRichard/KBQA-BERT
技术介绍:基于BERT的KBQA探索
由两个点组成:

  • 基于BERT的命名实体识别:在数据库中检索出与输入实体相关的所有三元组;
  • 基于BERT的句子相似度计算:计算句子和三元组的相似度,给出结果。
    ps:感觉这个项目更像搜索而非问答。

4. KGQA-Based-On-medicine 822 stars

https://github.com/YeYzheng/KGQA-Based-On-medicine
基于药品疾病知识库的问答系统。
使用语义网框架,包括SPARQL,Apache Jena。
通过python进行语义解析(分词?),生成SPARQL查询语句,交由Apache Jena Fuseki服务从TDB数据中查出结果。

5. CrimeKgAssitant: 752 stars

https://github.com/liuhuanyong/CrimeKgAssitant
面向法律问题的问答系统。

  • 罪名预测:按202种犯罪类型,对犯罪描述文本进行分类;
  • 法务咨询问题分类:按12种问题类型,进行分类;
  • 自动问答:根据问题,输出一些候选回答语句(感觉回答得比较敷衍)

6. QASystemOnMedicalGraph: 706 stars

https://github.com/zhihao-chen/QASystemOnMedicalGraph
基于知识图谱的问答系统,医疗领域。
数据库:neo4j
规模:包括15项信息,其中7类实体,约3.7万实体,21万实体关系。
包含意图分类功能。

7. QAonMilitaryKG: 393 stars

https://github.com/liuhuanyong/QAonMilitaryKG
军事知识库问答系统。
数据库:mongodb
采用工业级的问答架构,具有借鉴意义。

上一篇:通过RestAPI获取strapi的数据


下一篇:如何在github上准确的搜索 项目