深度学习常用数据集资源(计算机视觉领域)

目录

1、MNIST


2、ImageNet


4、COCO


5、PASCAL VOC


6、FDDB


1、MNIST

深度学习领域的入门数据集,当前主流的深度学习框架几乎都将MNIST数据集的处理入门第一教程。MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,每个样本图像的宽高为28*28,数字放在一个归一化的、固定尺寸的图片的中心。


数据集大小:~12MB


下载地址:http://yann.lecun.com/exdb/mnist/index.html


2、ImageNet  


深度学习常用数据集资源(计算机视觉领域)

Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。


Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。


数据集大小:~1TB


下载地址:http://www.image-net.org/about-stats


CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。CIFAR-100则是包含100个类,每类有600张图片,其中500张用于训练,100张用于测试;这100个类分组成20个超类。图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集,虽然用得人比以前少了很多,但仍然能用它做有趣的合理性测试。


数据集大小:~170MB


下载地址:http://www.cs.toronto.edu/~kriz/cifar.html


4、COCO  


深度学习常用数据集资源(计算机视觉领域)

COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。


数据集大小:~40GB


下载地址:http://mscoco.org/


5、PASCAL VOC

深度学习常用数据集资源(计算机视觉领域)

PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。


数据集大小:~2GB


下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html


6、FDDB


深度学习常用数据集资源(计算机视觉领域)

FDDB是全世界最具权威的人脸检测评测平台之一,包含2845张图片,共有5171个人脸作为测试集。测试集范围包括:不同姿势、不同分辨率、旋转和遮挡等图片,同时包括灰度图和彩色图,标准的人脸标注区域为椭圆形。该数据集的图片来自于美联社和路透社新闻报道图片,并删除了重复图片。


数据集大小:~550MB


下载地址:http://vis-www.cs.umass.edu/fddb/


上一篇:奇遇网络,谈谈我三年建站的经历


下一篇:2011年最佳免费 PSD 用户界面素材揭晓