行人重识别(5)——行人重识别Market1501数据集介绍

!转载请注明原文地址!——东方旅行者

本文目录

Market1501数据集

一、数据集简介

Market-1501数据集在清华大学校园中采集,夏天拍摄,在2015年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄的1501个行人的32217张图片。图片分辨率统一为128X64。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。
训练集bounding_box_train有751人,包含12,936张图像,平均每个人有17.2张训练数据;
测试集bounding_box_test有750人,包含19,732张图像,平均每个人有26.3张测试数据;
查询集query有3368张查询图像。
该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

二、目录结构及数据命名规则

Market-1501-v15.09.15
  ├── bounding_box_test
       ├── 0000_c1s1_000151_01.jpg
       ├── 0000_c1s1_000376_03.jpg
  ├── bounding_box_train
       ├── 0002_c1s1_000451_03.jpg
       ├── 0002_c1s1_000551_01.jpg
  ├── gt_bbox
       ├── 0001_c1s1_001051_00.jpg
       ├── 0001_c1s1_002301_00.jpg
  ├── gt_query
       ├── 0001_c1s1_001051_00_good.mat
       ├── 0001_c1s1_001051_00_junk.mat
  ├── query
       ├── 0001_c1s1_001051_00.jpg
       ├── 0001_c2s1_000301_00.jpg
  └── readme.txt

1.目录介绍

  1. “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
  2. “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
  3. “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
  4. “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
  5. “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box

2.数据文件命名规则

以 0001_c1s1_000151_01.jpg 为例

  1. 0001 表示每个人的标签编号,从0001到1501;
  2. c1 表示第一个摄像头(camera1),共有6个摄像头;
  3. s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
  4. 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
  5. 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

三、数据集下载地址

百度网盘:https://pan.baidu.com/s/1ntIi2Op

四、参考文献

Zheng L, Shen L, Tian L, et al. Scalable person re-identification: A benchmark[C]. ICCV, 2015: 1116-1124.

上一篇:二维数组转为树形数据


下一篇:那些曾虐我千百遍的计算机组成原理