Flan-T5基础大模型详细信息 | 数据学习(DataLearner)

Flan-T5基本信息

模型发布时间： 2022-10-20

模型发布机构： Google Research

模型所属类型：自然语言处理

模型官方地址：

Flan-T5大模型详细介绍

Flan-T5是Google发布的一个大模型。它是T5模型的增强版，基于不同任务进一步微调得到的结果。尽管它的参数与T5数量相同，但是模型的性能提高了2位数。

Google共开源了5个版本的Flan-T5模型，参数从8000万到110亿。

Flan-T5微调教程（基于DeepSpeed和Hugging Face Transformers）： https://github.com/philschmid/deep-learning-pytorch-huggingface/blob/main/training/deepseed-flan-t5-summarization.ipynb

原始论文： https://arxiv.org/abs/2210.11416

亚马逊的Flan-T5教程： https://aws.amazon.com/blogs/machine-learning/zero-shot-prompting-for-the-flan-t5-foundation-model-in-amazon-sagemaker-jumpstart/

https://exemplary.ai/blog/flan-t5

欢迎大家关注DataLearner官方微信，接受最新的AI技术推送

datalearner-wechat

Google Research

基于Flan-T5微调的模型列表