GU

Guanaco

基础大模型

Guanaco

发布时间: 2023-05-23更新于: 2023-05-31 23:44:15.822553
模型参数
650亿
上下文长度
2K
中文支持
不支持
推理能力

Guanaco 是由 华盛顿大学自然语言处理小组 发布的 AI 模型,发布时间为 2023-05-23,定位为 基础大模型,参数规模约为 650亿,上下文长度为 2K,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Guanaco

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-05-23
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
650亿 / 不涉及
知识截止
暂无数据
Guanaco

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
在线体验
暂无在线体验地址
Guanaco

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Guanaco

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Guanaco

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Guanaco

发布机构

华盛顿大学自然语言处理小组
查看发布机构详情
Guanaco

模型解读

Guanaco是华盛顿大学NLP小组发布的QLoRA方法的预训练结果模型,基于LLaMA微调。包含4个版本:


Guanaco模型名称Guanaco模型参数量
Guanaco 65B650亿
Guanaco 33B330亿
Guanaco 13B130亿
Guanaco 7B70亿


QLoRA是一种非常高效的大模型预训练技术,可以支持在单张专业级显卡微调650亿参数规模的大模型,具有很好的效果。关于QLoRA技术的简介: https://www.datalearner.com/blog/1051685029967582 


注意,Guanaco模型基于LLaMA模型微调得到,受限于LLaMA不允许商用的限制,Guanaco也不能商用!

基础模型

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码