h2oGPT - h2oGPT

模型详细情况和参数

h2oGPT

模型全称
h2oGPT
模型简称
h2oGPT
模型类型
基础大模型
发布日期
2023-04-19
预训练文件大小
41.4GB
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
200.0
模型代码开源协议
预训练结果开源商用情况
-
模型GitHub链接
https://github.com/h2oai/h2ogpt
在线演示地址
暂无
DataLearnerAI的模型介绍
官方博客论文
暂无
基础模型
...
GPT-Neo(X)
查看详情
发布机构

h2oGPT 简介

h2oGPT是H2O公司开源的一个类似ChatGPT的应用。是基于EleutherAI发布的GPT-NeoX-20b模型微调的结果。使用的是H2O自己收集的数据集。


h2oGPT的最大特点是具有完全宽松、商业可用的代码、数据和模型。


使用的是h2ogpt-oig-oasst1-instruct-cleaned-v1数据集做微调。H2O.ai 的 h2ogpt-oig-oasst1-instruct-cleaned-v1 是一个用于大型语言模型微调的开源指导类型数据集,可用于商业用途,包含349837条数据,共575MB。数据集的每一条有3列,分别是输入、来源和prompt_type。数据样例如下:



 数据集地址:https://huggingface.co/datasets/h2oai/h2ogpt-oig-oasst1-instruct-cleaned-v1 



欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

h2oGPT所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

h2oGPT相关的任务
问答系统

问答系统

Question Answering

35个资源