COCO数据集简介以及使用方法
数据集简介:
coco数据集,以val_2017为例,分为5个字段:
{
"info":
"licenses"
"images" : 图片的合集
"annotations" : 对象(物体)的合集
"categories" : 80个类的介绍
}
常用的有【images】和【annotations】:
【images】:
image{
"id" : 图片的ID编号
"width" : 宽
"height" : 高
"file_name" : 图片的名字
"license" :
"flickr_url" :
"coco_url" :
"date_captured" :
}
【annotations】:
annotation{
"id" : 图片中对象(物体)的编号,唯一
"image_id" : 对象所在的图片id
"category_id" : 对象的类别
"segmentation" : 对象的边界点
"area" : 对象的面积
"bbox" : [x,y,w,h]
"iscrowd" : 0/1
}
使用方法:
img_id = coco.getImgIds(index) #index:0~4999
file_name = coco.loadImgs(ids=[img_id])[0]['file_name']
"""
关于[0]的说明:
coco.loadImgs(ids=[img_id])返回[{'licenses':xxx, 'file_name':xxx, xxx}]
coco.loadImgs(ids=[img_id])[0]返回{'licenses':xxx, 'file_name':xxx, xxx}
也就是说,[0]完成了从list-->dict的转换
"""
ann_ids = coco.getAnnIds(imgIds=img_id) #获取图片编号为id中所有对象标注编号
anns = coco.loadAnns(ids=ann_ids) #获取上述对象标注的具体信息
一个例子:其中397133为图片id