开源问答系统调研

2023-10-27 19:50:10

开源问答系统调研

1. QABasedOnMedicaKnowledgeGraph 3.5k stars
2. haystack: 2.7k stars
3. KBQA-BERT: 998 stars
4. KGQA-Based-On-medicine 822 stars
5. CrimeKgAssitant: 752 stars
6. QASystemOnMedicalGraph: 706 stars
7. QAonMilitaryKG: 393 stars

各类关于CQA，KBQA，KGQA问答系统的研究层出不穷，本文面向中文智能问答系统在工业界落地的需求，调研了GIthub上几个具有借鉴意义的问答系统项目。

1. QABasedOnMedicaKnowledgeGraph 3.5k stars

https://github.com/liuhuanyong/QASystemOnMedicalKG
基于知识图谱的问答系统，医疗领域。
数据库：neo4j
规模：7类实体共4.4万个，约30万条关系，18种问答意图。

2. haystack: 2.7k stars

https://github.com/deepset-ai/haystack
端到端的问答框架，实现基于文档数据的语义搜索和问答。
可整合Huggingface’s Transformers, Elasticsearch, Milvus等工具。
可使用知识库进行查询（使用语义网标准，如RDF、SPARQL）。见文档

3. KBQA-BERT: 998 stars

https://github.com/WenRichard/KBQA-BERT
技术介绍：基于BERT的KBQA探索
由两个点组成：

基于BERT的命名实体识别：在数据库中检索出与输入实体相关的所有三元组；
基于BERT的句子相似度计算：计算句子和三元组的相似度，给出结果。
ps：感觉这个项目更像搜索而非问答。

4. KGQA-Based-On-medicine 822 stars

https://github.com/YeYzheng/KGQA-Based-On-medicine
基于药品疾病知识库的问答系统。
使用语义网框架，包括SPARQL，Apache Jena。
通过python进行语义解析（分词？），生成SPARQL查询语句，交由Apache Jena Fuseki服务从TDB数据中查出结果。

5. CrimeKgAssitant: 752 stars

https://github.com/liuhuanyong/CrimeKgAssitant
面向法律问题的问答系统。

罪名预测：按202种犯罪类型，对犯罪描述文本进行分类；
法务咨询问题分类：按12种问题类型，进行分类；
自动问答：根据问题，输出一些候选回答语句（感觉回答得比较敷衍）

6. QASystemOnMedicalGraph: 706 stars

https://github.com/zhihao-chen/QASystemOnMedicalGraph
基于知识图谱的问答系统，医疗领域。
数据库：neo4j
规模：包括15项信息，其中7类实体，约3.7万实体，21万实体关系。
包含意图分类功能。

7. QAonMilitaryKG: 393 stars

https://github.com/liuhuanyong/QAonMilitaryKG
军事知识库问答系统。
数据库：mongodb
采用工业级的问答架构，具有借鉴意义。

码农公寓