Vicuna

Vicuna是由多家研究机构合作推出的一个开源大语言模型,匿名评价效果拔群!

Vicuna基本信息

模型发布时间: 2023-03-31

模型发布机构: LM-SYS

模型所属类型: 自然语言处理

模型官方地址: https://lmsys.org/blog/2023-03-30-vicuna/

Vicuna大模型详细介绍

Vicuna是由多家研究机构合作推出的一个开源大语言模型,其研究团队来自于UC Berkeley、CMU、斯坦福、US San Dego和MBZUAI(阿拉伯联合酋长国默罕默德·本·扎耶德人工智能大学)。


该系列的模型是基于Meta LLaMA在SharedGPT开放数据集上微调得到。因此,模型本身受限于LLaMA的非商用限制以及OpenAI对ChatGPT共享数据集的限制。官方宣称该模型水平接近ChatGPT,并且超过其它开源的模型。



-------------------------2023年6月21日更新-------------------------

2023年6月21日,Vicuna系列发布了最新的Vicuna 33B(330亿参数规模)模型。并且Vicuna各个版本已经更新到了1.3版本。


--------------------------2023年6月之前的发布姐u共--------------------

截至2023年6月份,Vicuna发布了2个版本,一个是Vicuna-13B,一个是Vicuna-7B。前者是一个130亿规模的聊天机器人模型,后者参数规模70亿。


Vicuna系列模型的模型信息卡结果:

Vicuna系列模型参数规模基础模型模型卡地址
Vicuna 33B330亿LLaMA 33B https://www.datalearner.com/ai-models/pretrained-models/Vicuna-33B 
Vicuna 13B130亿LLaMA 13B https://www.datalearner.com/ai/pretrained-models/Vicuna-13B 
Vicuna 7B70亿LLaMA 7B https://www.datalearner.com/ai/pretrained-models/Vicuna-7B 



截止2023年6月21日,Vicuna系列更新到第三代,即1.3版本。所有的版数据如下:

Vicuna预训练权重版本v1.3v1.1v0
Vicuna预训练权重的下载地址7B13B33B7B13B7B13B
训练数据分隔符</s></s>###
是否是delta weights*NoYesYes
FastChat PyPI包版本要求>= v0.2.1>= v0.2.1<= v0.1.10
FastChat源码兼容情况after tag v0.2.1after tag v0.2.1tag v0.1.10

*注意:Vicuna系列模型是基于MetaAI开源的LLaMA模型微调得到,由于LLaMA开源限制,很多模型只发布与原始LLaMA预训练结果权重不同的部分,称为delta权重,使用时候必须与原始的LLaMA预训练合并才可以使用。


Vicuna项目的官方网址: https://lmsys.org/blog/2023-03-30-vicuna/ 

Vicuna项目在线使用地址: https://chat.lmsys.org/?arena 

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
datalearner-wechat
基于Vicuna微调的模型列表