MosaicML Pretrained Transformer - 7B Base
发布时间: 2023-05-05
2K tokens
基础大模型
2023-05-05
13.3GB
输入不支持
输入不支持
输入不支持
输入不支持
输入不支持
输出不支持
输出不支持
输出不支持
输出不支持
输出不支持
MPT-7B是由MosaicML推出的transformer系列大模型,是基于1万亿tokens的文本和代码训练的。这是一个完全开源且允许商用的大模型,质量与LLaMA-7B差不多。
MPT系列介绍: https://www.datalearner.com/ai-models/foundation-models/MPT
MPT-7B-Base是其中的基础模型,是一个decoder-style transformer,参数为67亿。它是在MosaicML的数据团队收集的1万亿文本和代码数据集上进行训练的。这个基本模型使用了用于快速训练和推理的FlashAttention,以及用于微调和外推到长上下文长度的ALiBi。
关注DataLearnerAI微信公众号,接受最新大模型资讯