ViT-22B

Vision Transformers-22B

预训练模型详情

模型全称

Vision Transformers-22B

模型简称

ViT-22B

发布日期

2023-02-10

预训练文件大小

未知

模型参数数量(亿)

220

模型链接

发布论文

Scaling Vision Transformers to 22 Billion Parameters

发布机构

基础模型

无基础模型

Vision Transformers-22B 简介

ViT-22B是谷歌最新发布的220亿参数的视觉大模型。此前,虽然语言模型的参数一直增长,但是在视觉领域,模型的参数只有40亿。而往上的规模训练会出现一些不稳定情况。因此谷歌精心设计了ViT模型,使其有很高的并行训练效率。

ViT-22B所属的领域
计算机视觉

计算机视觉

Computer Vision

35个资源

ViT-22B相关的任务
图像分类

图像分类

Image Classification

35个资源

图像生成

图像生成

Image Generation

35个资源