GPT-Neo
基础大模型GPT-Neo
模型参数
27亿
上下文长度
2K
中文支持
不支持
推理能力
GPT-Neo 是由 EleutherAI 发布的 AI 模型,发布时间为 2021-03-22,定位为 基础大模型,参数规模约为 27亿,上下文长度为 2K,采用 MIT License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
GPT-Neo
模型基本信息
推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2021-03-22
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
27亿 / 不涉及
知识截止
暂无数据
GPT-Neo
开源和体验地址
GPT-Neo
官方介绍与博客
官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
GPT-Neo
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
GPT-Neo
评测结果
当前尚无可展示的评测数据。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
GPT-Neo
发布机构
EleutherAI
查看发布机构详情 GPT-Neo
模型解读
GPT-Neo是一个由EleutherAI开发的最先进的语言模型。EleutherAI是一个独立的研究组织,致力于创建开源人工智能模型。GPT-Neo基于OpenAI的GPT系列语言模型的架构,但是采用了分散、社区驱动的方法进行训练。
GPT-Neo模型因其巨大的规模和在各种自然语言处理任务中出色的表现而备受关注。该模型的最大版本,GPT-Neo 2.7B,有27亿个参数,目前是存在的最大语言模型之一。它是在多样化的互联网文本数据上进行训练的,包括书籍、文章和网页,并且已经被证明在广泛的自然语言处理任务上表现良好,如语言生成、摘要和问答。
GPT-Neo项目的一个独特之处在于其强调开源开发和社区参与。EleutherAI公开了该模型的训练权重,使其他研究人员和开发人员能够使用和构建该模型。这导致了许多有趣的应用和GPT-Neo模型的扩展,包括对特定任务的微调和修改,以提高其在某些类型的数据上的效率或准确性。
总的来说,GPT-Neo代表了自然语言处理领域的一个令人兴奋的发展,其开源的本质使其成为全球研究人员和开发人员的宝贵资源。
基础模型
GPT-Neo(X)
查看详情DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
