GLUE Dataset

GLUE Dataset

1. XNLI

Multi-Genre Natural Language Inference(Cross-lingual),跨语言的自然语言推断,huggingface-xnli-zh-train部分在线示例
判断premise是否被hypothesis蕴含。label:neutral, entailment蕴含,contradiction矛盾.分类任务.
GLUE Dataset

2.QQP

Quora Question Pairs来自Quora的两个问题句子是否一致,一致标记为duplicate, 不一致:not_duplicate.判断两个句子是否意思一样。二分类任务.
huggingface-QQP-train部分在线示例
GLUE Dataset

3.QNLI

Question Natural Langiage Inference判断sentence是否包含question的答案.包含:entailment。二分类任务

QNLI 在线示例

GLUE Dataset

4.SST-2

SST-2 - Stanford Sentiment Treebank Stanford情感任务,判断句子是正向还是负向的。

SST-2在线示例
GLUE Dataset

5.CoLA

CoLA - Corpus of Linguistic Acceptability 判断句子语法是否正确。正确:acceptable.
GLUE Dataset

6.STS-B

Semantic Textual Similarity Benchmark :判断两个句子语义相似度,label:0-5浮点数。本质是回归任务,可以转换为5分类任务。

GLUE Dataset

7.MRPC

Microsoft Research Paraphrase Corpus判断两个句子语义是否相等.label:equivalent相等。
GLUE Dataset

8.RTE

Recognizing Textual Entailment: RTE也是文本蕴含任务,不同MNLI的3分类,它是2分类。not_entailment/entailment。

GLUE Dataset

9.WNLI

Winograd NLI文本蕴含任务,2分类。
GLUE Dataset

上一篇:htmlcss


下一篇:AWS 大数据实战 Lab2 - 批量数据处理(三)