Qwen2.5-3B - Qwen2.5-3B

模型详细情况和参数

Qwen2.5-3B

模型全称
Qwen2.5-3B
模型简称
Qwen2.5-3B
模型类型
基础大模型
发布日期
2024-09-18
预训练文件大小
6GB
是否支持中文(中文优化)
最高支持的上下文长度
32K
模型参数数量(亿)
30.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
Tongyi Qianwen RESEARCH LICENSE AGREEMENT - 免费商用授权
模型HuggingFace链接
https://huggingface.co/Qwen/Qwen2.5-3B
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
MMLU 知识问答 65.6
MMLU Pro 知识问答 34.6
GSM8K 数学推理 79.1
HumanEval 代码生成 42.1
MBPP 代码生成 57.1
MATH 数学推理 42.6
BBH 综合评估 56.3
GPQA Diamond 常识推理 24.3

Qwen2.5-3B 简介

Qwen2.5-3B是阿里巴巴开源的30亿参数规模的大语言模型。属于当前业界认为的可以在移动端运行的最高尺寸的大语言模型。该模型常规版本的文件大小为6GB,可以在手机端运行。该模型与阿里巴巴开源的其它2.5代模型最大的差异是开源协议不同。它的开源协议是Qwen Research协议,该开源协议是不允许商用的。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送