C-Eval

Chinese Evaluation Benchmark

一个涵盖人文社科、理工科等多个学科的中文多项选择题基准，用于评估模型在中文环境下的知识和推理能力。

中文难度：Advanced

问题数量

13948

机构

清华大学等

类别

知识问答

评估指标

Accuracy

论文链接数据集链接官方网站 DataLearnerAI详细介绍博客

C-Eval基准测试简介

模型简称	得分	发布机构	发布时间	参数规模（亿）
Hunyuan-T1	91.8		2025-03-21	0.0

Hunyuan-T1

得分:

91.8

发布时间:

2025-03-21

参数规模(亿):

0.0