Common Objects in Context之object Detection——COCO:津南数字制造算法挑战赛【赛场二】数据相关

我是在天池大赛的“津南数字制造算法挑战赛【赛场二】”中第一次了解到该数据集的。

什么是COCO?

COCO实质上是一些用于目标检测、图像分割、目标标注的数据集。在现在计算机视觉领域被大量使用。

赞助商

赞助商包括微软、facebook、Mighty AI、CVDF

Data format

相关地址
github API接口
COCO有五种注释类型,包括目标检测、关键点检测、物品分割、全景分割、图像标注。它们都是以json的形式存储的,

各类数据的公共部分如下

Common Objects in Context之object Detection——COCO:津南数字制造算法挑战赛【赛场二】数据相关

目标检测类(object Detection)

这也是“津南数字制造算法挑战赛【赛场二】“中提到的部分
Common Objects in Context之object Detection——COCO:津南数字制造算法挑战赛【赛场二】数据相关
每个对象实例都包含一系列字段,文中特别提及的几点如下。
1、iscrowd,取值为0/1. 当为0时,表示实例使用使用多边形检测,需要注意的是,就算单个目标也可能会出现多个多边形检测的拥堵现象;当为1时,为RLE检测,用于标注大组对象,比如一群人。
2、图中的封闭边界框的坐标是以左上角为原点的。
3、categories字段存储类别id、类别名称 和超类别名称的映射。


后面还有其他四类,由于比赛中没有提及,在这里不多做详述。如有需要可以查看链接