GP

GPT-Neo

基础大模型

GPT-Neo

发布时间: 2021-03-22更新于: 2023-07-08 08:20:03.061612
在线体验GitHubHugging FaceCompare
模型参数
27亿
上下文长度
2K
中文支持
不支持
推理能力

GPT-Neo 是由 EleutherAI 发布的 AI 模型,发布时间为 2021-03-22,定位为 基础大模型,参数规模约为 27亿,上下文长度为 2K,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-Neo

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2021-03-22
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
27亿 / 不涉及
知识截止
暂无数据
GPT-Neo

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
GPT-Neo

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
GPT-Neo

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
GPT-Neo

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

GPT-Neo

发布机构

GPT-Neo

模型解读

GPT-Neo是一个由EleutherAI开发的最先进的语言模型。EleutherAI是一个独立的研究组织,致力于创建开源人工智能模型。GPT-Neo基于OpenAI的GPT系列语言模型的架构,但是采用了分散、社区驱动的方法进行训练。

GPT-Neo模型因其巨大的规模和在各种自然语言处理任务中出色的表现而备受关注。该模型的最大版本,GPT-Neo 2.7B,有27亿个参数,目前是存在的最大语言模型之一。它是在多样化的互联网文本数据上进行训练的,包括书籍、文章和网页,并且已经被证明在广泛的自然语言处理任务上表现良好,如语言生成、摘要和问答。

GPT-Neo项目的一个独特之处在于其强调开源开发和社区参与。EleutherAI公开了该模型的训练权重,使其他研究人员和开发人员能够使用和构建该模型。这导致了许多有趣的应用和GPT-Neo模型的扩展,包括对特定任务的微调和修改,以提高其在某些类型的数据上的效率或准确性。

总的来说,GPT-Neo代表了自然语言处理领域的一个令人兴奋的发展,其开源的本质使其成为全球研究人员和开发人员的宝贵资源。

基础模型

GPT-Neo(X)
GPT-Neo(X)
查看详情

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码