Moonlight-16B-A3B-Instruct - Moonlight-16B-A3B-Instruct

模型详细情况和参数

Moonlight-16B-A3B-Instruct

模型全称
Moonlight-16B-A3B-Instruct
模型简称
Moonlight-16B-A3B-Instruct
模型类型
聊天大模型
发布日期
2025-02-23
预训练文件大小
32GB
是否支持中文(中文优化)
最高支持的上下文长度
8K
模型参数数量(亿)
160.0
模型代码开源协议
MIT License
预训练结果开源商用情况
MIT License - 免费商用授权
在线演示地址
暂无
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
MMLU 知识问答 70.0
MMLU Pro 知识问答 42.4
GSM8K 数学推理 77.4
HumanEval 代码生成 48.1
MBPP 代码生成 63.8
MATH 数学推理 45.3
BBH 综合评估 65.2

Moonlight-16B-A3B-Instruct 简介

月之暗面开源的一个160以参数的混合专家大模型,每次推理参数共30亿。效果超过同类型的大模型。


本版本是其指令优化后的版本。




关于Moonlight-16B-A3B模型的详细介绍参考DataLearnerAI的官方博客: https://www.datalearner.com/blog/1051740316091143 

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送