模型详细情况和参数
评测名称 | 评测能力方向 | 评测结果 |
---|---|---|
MMLU | 知识问答 | 88.5 |
MMLU Pro | 知识问答 | 75.9 |
GPQA Diamond | 常识推理 | 59.1 |
SimpleQA | 真实性评估 | 24.9 |
AIME 2024 | 数学推理 | 39.0 |
DeepSeek AI开源的大语言模型,是其开源的第三代大语言模型。DeepSeek V3是一个混合专家架构的模型(Mixture-of-Experts),总参数量6810亿,每次推理会激活其中370亿的参数。DeepSeek V3模型在14.8万亿tokens上完成训练,花费了278.8万个H800小时训练完成,其各项评测结果都十分优异。
本版本是经过后训练(Post Training)之后的版本。