ImageNet项目是一个大型视觉数据库,旨在用于视觉对象识别软件的研究。该项目对1400多万张图片进行了手工注释,以表明图片中的物体是什么,在至少100万张图片中,还提供了边界框。ImageNet包含2万多个类别,一个典型的类别,如 "气球 "或 "草莓",由几百张图片组成。第三方图片URL的注释数据库可以直接从ImageNet免费获得,尽管实际的图片不属于ImageNet。自2010年以来,ImageNet项目每年都会举办一次软件竞赛,即ImageNet大规模视觉识别挑战赛(ILSVRC),软件程序在竞赛中对物体和场景进行正确分类和检测。该挑战赛使用了一个由1000个不重叠的类组成的 "修剪 "列表。
该数据集直接促进了计算机视觉模型的对比基准,在图像分类和语义分割方面都有大量的模型进行了相关的测试。
——来自维基百科
官方网址: https://www.image-net.org/
数据集地址: https://www.kaggle.com/competitions/imagenet-object-localization-challenge/overview
PapersWithCode地址: https://paperswithcode.com/dataset/imagenet
发布者:Fei-Fei Li
发布时间:2006
官方网址:https://www.image-net.org/
数据记录总数:14197122
数据集大小:167.62 GB