网络知识 娱乐 CoCo数据集下载

CoCo数据集下载

文章目录

  • 1.介绍
  • 2.下载
    • 2.1 官网
    • 2.2 百度网盘
    • 2.3 下载到linux服务器

1.介绍

MS COCO的全称是Microsoft Common Objects in Context,起源于微软2014年的Microsoft COCO数据集

COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features

主要用于目标检测,图像分割,姿态估计等,共有80个类
在这里插入图片描述

更过内容可以看原始论文:Microsoft COCO: Common Objects in Context

2.下载

下载的方法很多,从我自己下载的经历来看,主要有这么几种方法

2.1 官网

第一种方法肯定是官网,来到下载页面:https://cocodataset.org/#download

在这里插入图片描述
Images就是数据集,Annotations表示标注信息使用 JSON 格式存储( annotations ), COCO API用于访问和操作所有“标注”进行预处理

在这里插入图片描述
不同年份的数据集用在不同的任务上,常用的是2017 train/val/test images

2.2 百度网盘

众所周知,官网不是就是访问不了,(有时是点了没反应,有时是无法安全下载)所以得采取别的方法。
从我自身角度,我是官网下载点了没反应,所以我就只能去找下载链接,直接将需要下载数据集的链接输入到浏览器,就可以自动下载了。
我把几个常见的下载链接列了出来(以2017为例)如果需要下载其他的可以仿照

数据集下载链接
2017 Train images [118K/18GB]http://images.cocodataset.org/zips/train2017.zip
2017 Val images [5K/1GB]http://images.cocodataset.org/zips/val2017.zip
2017 Test images [41K/6GB]http://images.cocodataset.org/zips/test2017.zip
2017 Train/Val annotations [241MB]http://images.cocodataset.org/annotations/annotations_trainval2017.zip

如果本地下载很慢(我试的时候挺快),可以用百度网盘的离线下载,打开百度网盘,点击离线下载,将上述链接输入,就可以保存到网盘了(也需要一点时间)
在这里插入图片描述

2.3 下载到linux服务器

如果是需要在服务器上进行跑实验,可以直接通过wget+下载链接
例如:

wget http://images.cocodataset.org/zips/train2017.zip
wget http://images.cocodataset.org/zips/val2017.zip
wget http://images.cocodataset.org/zips/test2017.zip

实测速度emmm
(其实这就属于linux的命令了,只要是把链接输入到浏览器能够直接下载的,那这个命令就可以用,其他数据集下载也可以参考这样)

也可以用aria2工具,一个命令行下载器(详细的介绍,可以参考:Aria2 安装和使用全教程)
在这里就用他的基本用法:

sudo apt-get install aria2  # sudo安装
# aria2c -c    #即为官网下载地址
aria2c -c http://images.cocodataset.org/zips/val2017.zip

实测速度会快一点……