SuperGLUE

Super Generalized Language Understanding Evaluation

一个包含 8 个自然语言理解任务的基准，旨在评估模型在复杂的语言理解和推理任务上的性能。

英语难度：Advanced

问题数量

8

机构

NYU & Facebook AI

类别

自然语言理解

评估指标

Varies

论文链接数据集链接官方网站 DataLearnerAI详细介绍博客

SuperGLUE基准测试简介

模型简称	得分	发布机构	发布时间	参数规模（亿）