HellaSwag

Hella Swag

一个包含 70,000 个多项选择题的基准,用于评估模型的常识推理能力。

英语 难度:Intermediate
问题数量

70000

机构

University of Washington

类别

常识推理

评估指标

Accuracy

HellaSwag基准测试简介

模型简称 得分 发布机构 发布时间 参数规模(亿)
加载中...