模型详细情况和参数
评测名称 | 评测能力方向 | 评测结果 |
---|---|---|
MMLU | 知识问答 | 86.1 |
MMLU Pro | 知识问答 | 58.1 |
GSM8K | 数学推理 | 91.5 |
HumanEval | 代码生成 | 59.1 |
MBPP | 代码生成 | 84.7 |
TruthfulQA | 真实性评估 | 60.4 |
MATH | 数学推理 | 62.1 |
BBH | 综合评估 | 86.3 |
GPQA Diamond | 常识推理 | 45.9 |
阿里开源的Qwen2.5系列模型中参数量最大的一个版本,720亿参数规模。其评测效果超过了MetaAI开源的同等参数规模的Llama-3-70B。产品月活低于1亿的商业应用是免费的。
720亿参数规模的Qwen2.5包含了多个版本,除了基座版本外,官方也开源了量化版本以及不同的指令微调版本,其结果如下:
Qwen2.5-72B版本 | 版本简介 | HuggingFace开源地址 |
---|---|---|
Qwen2.5-72B | 720亿参数规模的基座版本 | https://huggingface.co/Qwen/Qwen2.5-72B |
Qwen2.5-72B-Instruct | 指令微调版本 | https://huggingface.co/Qwen/Qwen2.5-72B-Instruct |
Qwen2.5-72B-Instruct-AWQ | AWQ的4bit量化版本的指令微调Qwen2.5 | https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-AWQ |
Qwen2.5-72B-Instruct-GPTQ | GPTQ量化版本的指令微调Qwen2.5,包含不同的量化水平 | Int8: https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 Int4: https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int4 |
Qwen2.5-72B-Instruct-GGUF | GGUF量化格式版本 | https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GGUF |