Super Generalized Language Understanding Evaluation
一个包含 8 个自然语言理解任务的基准,旨在评估模型在复杂的语言理解和推理任务上的性能。
8
NYU & Facebook AI
自然语言理解
Varies