ImageNet介绍:
ImageNet是现在公开的比较大的图片数据集,有上百G的数据,包含上千种的物体,支持物体的分类,识别,分割。
ImageNet竞赛:
Large Scale Visual Recognition Challenge,包括三种,图片分类,物体识别,物体分割。以前竞赛由imagenet组织,现在由kaggle组织。
竞赛官网:
http://www.image-net.org/ 或者 https://www.kaggle.com/c/imagenet-object-localization-challenge
ImageNet官网:
http://www.image-net.org/
下载地址:
http://www.image-net.org/ 或者 https://link.zhihu.com/?target=http%3A//pan.baidu.com/s/1dDizyed%23path%3D%25252F
Pascal VOC介绍:
PASCAL VOC(pattern analysis,statistical modelling and computational learning visual object classes)是一个图片数据集,支持的物体种类为20种,支持物体的分类,识别,分割。2007年的数据集和2012年的数据集是大家常用的数据集。
Pascal VOC竞赛:
The PASCAL Visual Object Classes (VOC) Challenge, 这个竞赛在2012年以后停办,
竞赛官网:
http://host.robots.ox.ac.uk/pascal/VOC/
Pascal VOC官网:
http://host.robots.ox.ac.uk/pascal/VOC/
下载地址:
https://pjreddie.com/projects/pascal-voc-dataset-mirror/或者https://pan.baidu.com/s/1oAh0JPo
CIFAR介绍:
CIFAR分为CIFAR-10和CIFAR-100,CIFAR只支持用来做图像分类,CIFAR-10共有10中类别,CIFAR-100共有100中类别。
CIFAR-10有60000张32*32的彩色图片,每种分类6000张,支持的10个类别
CIFAR-100支持的100中类型如下,每种分类600张
CIFAR官网: http://www.cs.toronto.edu/~kriz/cifar.html
下载地址:
http://www.cs.toronto.edu/~kriz/cifar.html或者https://pan.baidu.com/s/1dGiiOXr
MNIST介绍:
深度学习领域的入门数据集,提供手写数字,用来做手写数字的分类。大约有70000张图片,是黑白图片,但是要注意数据集是白底黑字还是黑底白字。
CIFAR官网: http://yann.lecun.com/exdb/mnist/
下载地址: http://yann.lecun.com/exdb/mnist/或者https://pan.baidu.com/s/1ghdBpAj
NYU Depth Dataset V2:
很大的一个数据集,主要针对室内,图片有深度信息。
NYU Depth Dataset V2官网: https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html
下载地址: https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html
Visual Dictionary:
CIFAR是他的一个子集,里面有很多小的图片。
Visual Dictionary官网: http://groups.csail.mit.edu/vision/TinyImages/
下载地址: http://groups.csail.mit.edu/vision/TinyImages/
COCO:
COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集,其官方说明网址:http://mscoco.org/。
该数据集主要有的特点如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people
为了更好的介绍这个数据集,微软在ECCV Workshops里发表这篇文章:Microsoft COCO: Common Objects in Context。从这篇文章中,我们了解了这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。
COCO官网: http://mscoco.org/
下载地址:
http://mscoco.org/
使用wget -c(断点续传)下载速度很快
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip