开源问答系统调研
- 1. QABasedOnMedicaKnowledgeGraph 3.5k stars
- 2. haystack: 2.7k stars
- 3. KBQA-BERT: 998 stars
- 4. KGQA-Based-On-medicine 822 stars
- 5. CrimeKgAssitant: 752 stars
- 6. QASystemOnMedicalGraph: 706 stars
- 7. QAonMilitaryKG: 393 stars
各类关于CQA,KBQA,KGQA问答系统的研究层出不穷,本文面向中文智能问答系统在工业界落地的需求,调研了GIthub上几个具有借鉴意义的问答系统项目。
1. QABasedOnMedicaKnowledgeGraph 3.5k stars
https://github.com/liuhuanyong/QASystemOnMedicalKG
基于知识图谱的问答系统,医疗领域。
数据库:neo4j
规模:7类实体共4.4万个,约30万条关系,18种问答意图。
2. haystack: 2.7k stars
https://github.com/deepset-ai/haystack
端到端的问答框架,实现基于文档数据的语义搜索和问答。
可整合Huggingface’s Transformers, Elasticsearch, Milvus等工具。
可使用知识库进行查询(使用语义网标准,如RDF、SPARQL)。见文档
3. KBQA-BERT: 998 stars
https://github.com/WenRichard/KBQA-BERT
技术介绍:基于BERT的KBQA探索
由两个点组成:
- 基于BERT的命名实体识别:在数据库中检索出与输入实体相关的所有三元组;
- 基于BERT的句子相似度计算:计算句子和三元组的相似度,给出结果。
ps:感觉这个项目更像搜索而非问答。
4. KGQA-Based-On-medicine 822 stars
https://github.com/YeYzheng/KGQA-Based-On-medicine
基于药品疾病知识库的问答系统。
使用语义网框架,包括SPARQL,Apache Jena。
通过python进行语义解析(分词?),生成SPARQL查询语句,交由Apache Jena Fuseki服务从TDB数据中查出结果。
5. CrimeKgAssitant: 752 stars
https://github.com/liuhuanyong/CrimeKgAssitant
面向法律问题的问答系统。
- 罪名预测:按202种犯罪类型,对犯罪描述文本进行分类;
- 法务咨询问题分类:按12种问题类型,进行分类;
- 自动问答:根据问题,输出一些候选回答语句(感觉回答得比较敷衍)
6. QASystemOnMedicalGraph: 706 stars
https://github.com/zhihao-chen/QASystemOnMedicalGraph
基于知识图谱的问答系统,医疗领域。
数据库:neo4j
规模:包括15项信息,其中7类实体,约3.7万实体,21万实体关系。
包含意图分类功能。
7. QAonMilitaryKG: 393 stars
https://github.com/liuhuanyong/QAonMilitaryKG
军事知识库问答系统。
数据库:mongodb
采用工业级的问答架构,具有借鉴意义。