模型详细情况和参数
RedPajama-2.8B是TOGETHER在2023年5月1日透露的正在训练的模型。
RedPajama是TOGETHER官方宣布的一项开源项目,其目的是基于MetaAI提供的论文,使用1.2万亿tokens的数据来复现LLaMA的训练过程。该项目最早宣布的是其数据集,4月25日透露正在训练RedPajama-7B模型已经在训练了4400亿tokens数据集之后超过了Pythia-7B的能力。
5月1日,官方透露他们正在训练的28亿参数版本的RedPajama-2.8B,在训练了6000亿tokens数据之后已经超过Pythia-2.8B和GPT-Neo 2.7B的模型。几乎与Pythia-7B模型的能力相当!