Moonlight-16B-A3B-Instruct

Name: Moonlight-16B-A3B-Instruct
Price: 免费商用授权
Rating: 5

聊天大模型

发布时间: 2025-02-23

GitHub Hugging Face 在线体验

模型参数（Parameters）

160.0

最高上下文长度（Context Length）

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

8K tokens

最长输出结果

暂无数据

模型类型

聊天大模型

发布时间

2025-02-23

模型预文件大小

32GB

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License - 免费商用授权

GitHub 源码

https://github.com/MoonshotAI/Moonlight

Hugging Face

https://huggingface.co/moonshotai/Moonlight-16B-A3B-Instruct

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

Muon is Scalable for LLM Training

DataLearnerAI博客

月之暗面开源了一个全新的160亿参数规模的MoE大语言模型Moonlight-16B：其训练算力仅需业界主流的一半

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

Moonlight-16B-A3B-Instruct模型在各大评测榜单的评分

评测基准名称

评测类型

评测结果

评测基准名称

MMLU

(知识问答)

评测结果：70.0

MMLU

知识问答

70.0

评测基准名称

MMLU Pro

(知识问答)

评测结果：42.4

MMLU Pro

知识问答

42.4

评测基准名称

GSM8K

(数学推理)

评测结果：77.4

GSM8K

数学推理

77.4

评测基准名称

HumanEval

(代码生成)

评测结果：48.1

HumanEval

代码生成

48.1

评测基准名称

MBPP

(代码生成)

评测结果：63.8

MBPP

代码生成

63.8

评测基准名称

MATH

(数学推理)

评测结果：45.3

MATH

数学推理

45.3

评测基准名称

BBH

(综合评估)

评测结果：65.2

BBH

综合评估

65.2

发布机构

Moonshot AI

查看发布机构详情

模型介绍

月之暗面开源的一个160以参数的混合专家大模型，每次推理参数共30亿。效果超过同类型的大模型。

本版本是其指令优化后的版本。

关于Moonlight-16B-A3B模型的详细介绍参考DataLearnerAI的官方博客： https://www.datalearner.com/blog/1051740316091143

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯