Vicuna基础大模型详细信息 | 数据学习(DataLearner)

模型发布时间： 2023-03-31

模型发布机构： LM-SYS

模型所属类型：自然语言处理

Vicuna是由多家研究机构合作推出的一个开源大语言模型，其研究团队来自于UC Berkeley、CMU、斯坦福、US San Dego和MBZUAI（阿拉伯联合酋长国默罕默德·本·扎耶德人工智能大学）。

该系列的模型是基于Meta LLaMA在SharedGPT开放数据集上微调得到。因此，模型本身受限于LLaMA的非商用限制以及OpenAI对ChatGPT共享数据集的限制。官方宣称该模型水平接近ChatGPT，并且超过其它开源的模型。

-------------------------2023年6月21日更新-------------------------

2023年6月21日，Vicuna系列发布了最新的Vicuna 33B（330亿参数规模）模型。并且Vicuna各个版本已经更新到了1.3版本。

--------------------------2023年6月之前的发布姐u共--------------------

截至2023年6月份，Vicuna发布了2个版本，一个是Vicuna-13B，一个是Vicuna-7B。前者是一个130亿规模的聊天机器人模型，后者参数规模70亿。

Vicuna系列模型的模型信息卡结果：

Vicuna系列	模型参数规模	基础模型	模型卡地址
Vicuna 33B	330亿	LLaMA 33B	https://www.datalearner.com/ai-models/pretrained-models/Vicuna-33B
Vicuna 13B	130亿	LLaMA 13B	https://www.datalearner.com/ai/pretrained-models/Vicuna-13B
Vicuna 7B	70亿	LLaMA 7B	https://www.datalearner.com/ai/pretrained-models/Vicuna-7B

截止2023年6月21日，Vicuna系列更新到第三代，即1.3版本。所有的版数据如下：

Vicuna预训练权重版本	v1.3	v1.1	v0
Vicuna预训练权重的下载地址	7B, 13B, 33B	7B, 13B	7B, 13B
训练数据分隔符	`</s>`	`</s>`	`###`
是否是delta weights*	No	Yes	Yes
FastChat PyPI包版本要求	>= v0.2.1	>= v0.2.1	<= v0.1.10
FastChat源码兼容情况	after tag v0.2.1	after tag v0.2.1	tag v0.1.10

*注意：Vicuna系列模型是基于MetaAI开源的LLaMA模型微调得到，由于LLaMA开源限制，很多模型只发布与原始LLaMA预训练结果权重不同的部分，称为delta权重，使用时候必须与原始的LLaMA预训练合并才可以使用。

Vicuna项目在线使用地址： https://chat.lmsys.org/?arena

Vicuna