Dolly

Dolly基本信息

模型发布时间: 2023-03-24

模型发布机构: databricks

模型所属类型: 自然语言处理

模型官方地址:

Dolly大模型详细介绍

Dolly是由Databricks在2023年3月发布的一系列大语言模型。最早的版本是60亿参数,基于EleutherAI的GPT-J-6B( https://www.datalearner.com/ai-models/pretrained-models/GPT-J%206B )训练得到。Dolly的工作原理是将现有的EleutherAI开源的60亿参数模型进行微调,从而激发出像头脑风暴和文本生成这样的指令跟踪能力,这些能力在原始模型中并不存在,使用了Alpaca的数据。


仅仅一个月不到,Dolly的v2系列发布。Dolly 2.0是一种基于EleutherAI pythia模型家族的12亿参数的语言模型,专门在一组新的高质量人类生成的指令跟踪数据集上进行微调,这些数据集是由Databricks员工众包生成的。也就是说Dolly2换了基础模型?。


重要的是,Dolly系列模型完全开源。包括训练代码、数据集和模型权重等。

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
datalearner-wechat
基于Dolly微调的模型列表