C-Eval

Chinese Evaluation Benchmark

一个涵盖人文社科、理工科等多个学科的中文多项选择题基准,用于评估模型在中文环境下的知识和推理能力。

中文 难度:Advanced
问题数量

13948

机构

清华大学等

类别

知识问答

评估指标

Accuracy

C-Eval基准测试简介

模型简称 得分 发布机构 发布时间 参数规模(亿)
加载中...