COCO全称是Common Objects in Contenxt,由微软研究院和几位高校老师合作发布的图像数据集。最早的版本是2015年发布,2107年发布了新的版本。
各个版本的记录数如下:
年份(年) | 数据集类型 | 记录数(万张) | 大小(GB) |
---|---|---|---|
2014 | 训练集 | 8.3 | 13 |
2014 | 验证集 | 4.1 | 6 |
2014 | 测试集 | 4.1 | 6 |
2015 | 测试集 | 8.1 | 12 |
2017 | 训练集 | 11.8 | 18 |
2017 | 验证集 | 0.5 | 1 |
2017 | 测试集 | 4.1 | 6 |
2017 | 未标注数据 | 12.3 | 19 |
COCO数据集十分著名,也和历年的学术会议挑战赛有关。不同年份的数据集也被用来测试不同任务。这些数据支持的任务包括图像检测(Detection)、图像描述(Captioning)、关键点(keypoint)、具有特定尺寸和形状的物体(COCO Stuff )、全景分割(Panoptic Segmentation)等。
这份数据的标注也很详细。具体来说:
需要注意的是:
官方下载地址: https://cocodataset.org/#download
GitHub地址: https://github.com/cocodataset/cocodataset.github.io
PapersWithCode地址: https://deepai.org/dataset/coco
发布者:Microsoft
发布时间:2014年
官方网址:https://cocodataset.org/
数据记录总数:167000
数据集大小:25GB