C-Eval

Chinese Evaluation Benchmark

一个涵盖人文社科、理工科等多个学科的中文多项选择题基准,用于评估模型在中文环境下的知识和推理能力。

中文 难度:Advanced
问题数量

13948

机构

清华大学等

类别

知识问答

评估指标

Accuracy

C-Eval基准测试简介

模型简称 得分 发布机构 发布时间 参数规模(亿)
Hunyuan-T1 91.8 腾讯AI实验室 2025-03-21 0.0
得分:
91.8
发布时间:
2025-03-21
参数规模(亿):
0.0