GPT-3（Generative Pre-trained Transformer 3）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息

GPT-3 - Generative Pre-trained Transformer 3

模型详细情况和参数

GPT-3

模型全称: Generative Pre-trained Transformer 3
模型简称: GPT-3
模型类型: 基础大模型
发布日期: 2020-05-28
预训练文件大小: 未知
是否支持中文（中文优化）: 是
最高支持的上下文长度: 2K
模型参数数量（亿）: 1750.0
模型代码开源协议: 不开源
预训练结果开源商用情况: 不开源 - 不开源
模型GitHub链接: 暂无
模型HuggingFace链接: 暂无
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: Language Models are Few-Shot Learners
基础模型: GPT
查看详情
发布机构: OpenAI

Generative Pre-trained Transformer 3 简介

GPT-3是OpenAI发布的迄今为止最强大的大语言预训练模型之一。GPT-3是OpenAI的第三代自回归语言模型。相比较GPT-2，GPT-3模型参数大了2个量级，达到了1750个参数。

由于GPT-3太过强大，OpenAI认为可能会出现利用这个模型实施各种“不好”的事情行为。因此他们并没有公开这个模型，这也与他们建立之初作为一个非盈利的开放AI研究机构相违背。起初，这种行为遭到了大量的批评。但是，现在发现这个模型的确可能会导致很多坏事情，而且各大企业也都不再开放这种模型，因此，批评声音逐渐减弱了。

GPT-3模型的训练来自大量的互联网无标注数据。根据维基百科的介绍，其权重占比如下：