加载中...
加载中...
RedPajama-2.8B
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
RedPajama-2.8B是TOGETHER在2023年5月1日透露的正在训练的模型。
RedPajama是TOGETHER官方宣布的一项开源项目,其目的是基于MetaAI提供的论文,使用1.2万亿tokens的数据来复现LLaMA的训练过程。该项目最早宣布的是其数据集,4月25日透露正在训练RedPajama-7B模型已经在训练了4400亿tokens数据集之后超过了Pythia-7B的能力。
5月1日,官方透露他们正在训练的28亿参数版本的RedPajama-2.8B,在训练了6000亿tokens数据之后已经超过Pythia-2.8B和GPT-Neo 2.7B的模型。几乎与Pythia-7B模型的能力相当!
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
