T5（Text-to-Text Transfer Transformer）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息

T5 - Text-to-Text Transfer Transformer

模型详细情况和参数

T5

模型全称: Text-to-Text Transfer Transformer
模型简称: T5
模型类型: 基础大模型
发布日期: 2019-10-23
预训练文件大小: 21GB
是否支持中文（中文优化）: 否
最高支持的上下文长度: 2K
模型参数数量（亿）: 110.0
模型代码开源协议
预训练结果开源商用情况: -
模型GitHub链接: 暂无
模型HuggingFace链接: 暂无
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
基础模型: 无基础模型
发布机构: Google Research

Text-to-Text Transfer Transformer 简介

T5全称是Text-to-Text Transfer Transformer，是谷歌研究人员在2019年提出的一个研究框架和预训练模型。在2019年，谷歌研究人员已经意识到基于未标注的大量文本数据训练大模型作为下游任务的基础是一种十分高效的自然语言处理方法。这种方法的主要目的是使模型开发通用能力和知识，然后将其转移到下游任务。但是，快速发展的预训练模型让大家难以比较不同的方法。为此，谷歌在这篇论文中提出将NLP领域的预训练任务当作一个text-to-text任务。然后基于这个框架来研究NLP预训练模型。

区别于之前的模型，由于谷歌将预训练任务当作一个text-to-text任务，因此不需要标注数据，也就是不需要BERT那种模型，于是，谷歌提出了T5模型，将NLP领域的问答系统、语言模型等任务都当作了Text-to-Text任务。如下图所示：