常见数据集简介
ImageNet
ImageNet数据集共有1400多万张图片,2万多个类别,超过百万的图片有明确的类别标注以及物体的位置信息。
PASCAL VOC
PASCAL(pattern analysis, statistical modelling and computational learning) VOC为图像分类与图像检测提供了一整套标准的数据集。其中常用的数据集有VOC 2007和VOC 2012。VOC图像质量较好,标注比较完整,适合进行模型的性能检测
VOC 2007 包含9963张标注过的图片以及24640个物体标签
VOC 2012 包含11530张图片,包含20个物体类别,图片大小约500 375.
PASCAL VOC还提供了一套标准数据集格式,尤其是对于物体检测领域,大部分开源物体检测算法都提供了PASCAL VOC的数据接口。对于物体检测,有3个重要文件夹:
- JPEGImages:包含所有训练与测试的图片
- Annotations:存放XML格式的标签数据,每一个XML文件都对应于JPEGImages文件夹下的一张图片
- ImageSets:物体检测只需要Main子文件夹,并在Main文件夹中建立Trainval.txt、train.txt、val.txt、test.txt,在个文件中记录相应的图片名即可
COCO(Common Objects in Context)
COCO针对物体检测、分割、图像语义理解和人体关节点等,拥有超过30万张图片,200多万个实例及80个物体类别。相比于PASCAL VOC,COCO数据集难度更大,拥有的小物体更多,物体大小的跨度也更大
众多开源算法也会提供以COCO格式为标准的数据加载方式
CIFAR10
CIFAR10数据集包含十个类别:‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’。图像尺寸为