Qwen2.5-72B - Qwen2.5-72B

模型详细情况和参数

Qwen2.5-72B

模型全称
Qwen2.5-72B
模型简称
Qwen2.5-72B
模型类型
基础大模型
发布日期
2024-09-18
预训练文件大小
144GB
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
727.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
Qwen License - 免费商用授权
模型HuggingFace链接
https://huggingface.co/Qwen/Qwen2.5-72B
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
MMLU 知识问答 86.1
MMLU Pro 知识问答 58.1
GSM8K 数学推理 91.5
HumanEval 代码生成 59.1
MBPP 代码生成 84.7
TruthfulQA 真实性评估 60.4
MATH 数学推理 62.1
BBH 综合评估 86.3
GPQA Diamond 常识推理 45.9

Qwen2.5-72B 简介

阿里开源的Qwen2.5系列模型中参数量最大的一个版本,720亿参数规模。其评测效果超过了MetaAI开源的同等参数规模的Llama-3-70B。产品月活低于1亿的商业应用是免费的。


720亿参数规模的Qwen2.5包含了多个版本,除了基座版本外,官方也开源了量化版本以及不同的指令微调版本,其结果如下:


Qwen2.5-72B版本版本简介HuggingFace开源地址
Qwen2.5-72B720亿参数规模的基座版本 https://huggingface.co/Qwen/Qwen2.5-72B 
Qwen2.5-72B-Instruct指令微调版本 https://huggingface.co/Qwen/Qwen2.5-72B-Instruct 

Qwen2.5-72B-Instruct-AWQ
AWQ的4bit量化版本的指令微调Qwen2.5 https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-AWQ 
Qwen2.5-72B-Instruct-GPTQGPTQ量化版本的指令微调Qwen2.5,包含不同的量化水平Int8: https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
Int4: https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int4
Qwen2.5-72B-Instruct-GGUFGGUF量化格式版本 https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GGUF 


欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Qwen2.5-72B所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

Qwen2.5-72B相关的任务
问答系统

问答系统

Question Answering

35个资源