模型详细情况和参数
这是第一个通过强化学习从人类反馈中训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的LLaMA 13b模型。
StableVicuna由StabilityAI发布,完全开源。