Qwen2.5-7B - Qwen2.5-7B

模型详细情况和参数

Qwen2.5-7B

模型全称
Qwen2.5-7B
模型简称
Qwen2.5-7B
模型类型
基础大模型
发布日期
2024-09-18
预训练文件大小
14GB
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
70.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
Apache 2.0 - 免费商用授权
模型HuggingFace链接
https://huggingface.co/Qwen/Qwen2.5-7B
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
MMLU 知识问答 74.2
MMLU Pro 知识问答 45.0
GSM8K 数学推理 85.4
HumanEval 代码生成 57.9
MBPP 代码生成 74.9
ARC 常识推理 63.7
MATH 数学推理 49.8
GPQA Diamond 常识推理 36.4

Qwen2.5-7B 简介

        

阿里巴巴开源的千问大模型,是2.5代的70亿参数规模大语言模型。以Apache2.0开源协议开源,意味着可以完全免费商用,协议非常友好。


Qwen2.5-7B开源了多个不同的版本,包括基座版本和指令微调的版本:

Qwen2.5-7B版本版本简介HuggingFace开源地址
Qwen2.5-7B320亿参数的基座模型 https://huggingface.co/Qwen/Qwen2.5-7B 
Qwen2.5-7B-Instruct指令微调版本 https://huggingface.co/Qwen/Qwen2.5-7B-Instruct 

Qwen2.5-7B-Instruct-AWQ
AWQ的4bit量化版本的指令微调Qwen2.5 https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-AWQ 
Qwen2.5-7B-Instruct-GPTQGPTQ量化版本的指令微调Qwen2.5,包含不同的量化水平Int8:  https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-GPTQ-Int8 
Int4: https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-GPTQ-Int4
Qwen2.5-7B-Instruct-GGUFGGUF量化格式https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-GGUF


欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送