GLUE Dataset
1. XNLI
Multi-Genre Natural Language Inference(Cross-lingual),跨语言的自然语言推断,huggingface-xnli-zh-train部分在线示例。
判断premise是否被hypothesis蕴含。label:neutral, entailment蕴含,contradiction矛盾.分类任务.
2.QQP
Quora Question Pairs来自Quora的两个问题句子是否一致,一致标记为duplicate, 不一致:not_duplicate.判断两个句子是否意思一样。二分类任务.
huggingface-QQP-train部分在线示例
3.QNLI
Question Natural Langiage Inference判断sentence是否包含question的答案.包含:entailment。二分类任务
4.SST-2
SST-2 - Stanford Sentiment Treebank Stanford情感任务,判断句子是正向还是负向的。
5.CoLA
CoLA - Corpus of Linguistic Acceptability 判断句子语法是否正确。正确:acceptable.
6.STS-B
Semantic Textual Similarity Benchmark :判断两个句子语义相似度,label:0-5浮点数。本质是回归任务,可以转换为5分类任务。
7.MRPC
Microsoft Research Paraphrase Corpus判断两个句子语义是否相等.label:equivalent相等。
8.RTE
Recognizing Textual Entailment: RTE也是文本蕴含任务,不同MNLI的3分类,它是2分类。not_entailment/entailment。
9.WNLI
Winograd NLI文本蕴含任务,2分类。