MPT-7B-Instruct（MosaicML Pretrained Transformer - 7B Instruct）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息

MPT-7B-Instruct - MosaicML Pretrained Transformer - 7B Instruct

模型详细情况和参数

模型全称: MosaicML Pretrained Transformer - 7B Instruct
模型简称: MPT-7B-Instruct
模型类型: 基础大模型
发布日期: 2023-05-05
预训练文件大小: 13.3GB
是否支持中文（中文优化）: 否
最高支持的上下文长度: 2K
模型参数数量（亿）: 67.0
模型代码开源协议: Apache 2.0
预训练结果开源商用情况: CC-By-SA-3.0 - 免费商用授权
模型GitHub链接: https://github.com/mosaicml/llm-foundry
模型HuggingFace链接: https://huggingface.co/mosaicml/mpt-7b-instruct
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: Introducing MPT-7B: A New Standard for Open-Source, Commercially Usable LLMs
基础模型: MPT
查看详情
发布机构: MosaicML

MPT-7B-Instruct是MPT-7B系列模型中针对指令优化的模型。MPT是由MosaicML推出的transformer系列大模型，其中7B是指67亿参数规模，MPT全称MosaicML Pretrained Transformer。

MPT-7B-Instruct是基于MPT-7B-Base进行指令微调得到的模型。其微调数据集源自Databricks Dolly-15k和Anthropic的HH数据集（HH表示Helpful and Harmless）。这两个数据集相关的链接如下：

数据集名称	发布者	数据集链接
Dolly-15k	Databricks	https://huggingface.co/datasets/databricks/databricks-dolly-15k
HH数据集	Anthropic	https://huggingface.co/datasets/Anthropic/hh-rlhf

MPT-7B-Base模型本身是基于MosaicML机器学习团队收集的1万亿tokens文本和代码数据集训练的。经过上述两类指令数据集微调之后，MPT-7B-Instruct对指令的识别比原始模型要好很多。