Vicuna是由多家研究机构合作推出的一个开源大语言模型,匿名评价效果拔群!
模型发布时间: 2023-03-31
模型发布机构: LM-SYS
模型所属类型: 自然语言处理
模型官方地址: https://lmsys.org/blog/2023-03-30-vicuna/
Vicuna是由多家研究机构合作推出的一个开源大语言模型,其研究团队来自于UC Berkeley、CMU、斯坦福、US San Dego和MBZUAI(阿拉伯联合酋长国默罕默德·本·扎耶德人工智能大学)。
该系列的模型是基于Meta LLaMA在SharedGPT开放数据集上微调得到。因此,模型本身受限于LLaMA的非商用限制以及OpenAI对ChatGPT共享数据集的限制。官方宣称该模型水平接近ChatGPT,并且超过其它开源的模型。
-------------------------2023年6月21日更新-------------------------
2023年6月21日,Vicuna系列发布了最新的Vicuna 33B(330亿参数规模)模型。并且Vicuna各个版本已经更新到了1.3版本。
--------------------------2023年6月之前的发布姐u共--------------------
截至2023年6月份,Vicuna发布了2个版本,一个是Vicuna-13B,一个是Vicuna-7B。前者是一个130亿规模的聊天机器人模型,后者参数规模70亿。
Vicuna系列模型的模型信息卡结果:
Vicuna系列 | 模型参数规模 | 基础模型 | 模型卡地址 |
---|---|---|---|
Vicuna 33B | 330亿 | LLaMA 33B | https://www.datalearner.com/ai-models/pretrained-models/Vicuna-33B |
Vicuna 13B | 130亿 | LLaMA 13B | https://www.datalearner.com/ai/pretrained-models/Vicuna-13B |
Vicuna 7B | 70亿 | LLaMA 7B | https://www.datalearner.com/ai/pretrained-models/Vicuna-7B |
截止2023年6月21日,Vicuna系列更新到第三代,即1.3版本。所有的版数据如下:
Vicuna预训练权重版本 | v1.3 | v1.1 | v0 |
---|---|---|---|
Vicuna预训练权重的下载地址 | 7B, 13B, 33B | 7B, 13B | 7B, 13B |
训练数据分隔符 | </s> | </s> | ### |
是否是delta weights* | No | Yes | Yes |
FastChat PyPI包版本要求 | >= v0.2.1 | >= v0.2.1 | <= v0.1.10 |
FastChat源码兼容情况 | after tag v0.2.1 | after tag v0.2.1 | tag v0.1.10 |
*注意:Vicuna系列模型是基于MetaAI开源的LLaMA模型微调得到,由于LLaMA开源限制,很多模型只发布与原始LLaMA预训练结果权重不同的部分,称为delta权重,使用时候必须与原始的LLaMA预训练合并才可以使用。
Vicuna项目的官方网址: https://lmsys.org/blog/2023-03-30-vicuna/
Vicuna项目在线使用地址: https://chat.lmsys.org/?arena