TruthfulQA

TruthfulQA

一个包含 817 个问题的基准,旨在评估模型是否能够生成真实且准确的答案,而不是编造信息。

英语 难度:Advanced
问题数量

817

机构

Google

类别

真实性评估

评估指标

Accuracy

TruthfulQA基准测试简介

模型简称 得分 发布机构 发布时间 参数规模(亿)
加载中...