Person Re-ID行人重试别数据集

Person Re-ID行人重试别数据集

1. 杜克大学数据(DukeMTMC-reID)

DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集。它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集,具有 7,000 多个单摄像机轨迹和超过 2,700 多个独立人物,DukeMTMC-reID 是 DukeMTMC 数据集的行人重识别子集,并且提供了人工标注的bounding box。

目录结构

DukeMTMC-reID
  ├── bounding_box_test
       ├── 0002_c1_f0044158.jpg
       ├── 3761_c6_f0183709.jpg
       ├── 7139_c2_f0160815.jpg
  ├── bounding_box_train
       ├── 0001_c2_f0046182.jpg
       ├── 0008_c3_f0026318.jpg
       ├── 7140_c4_f0175988.jpg
  ├── query
       ├── 0005_c2_f0046985.jpg
       ├── 0023_c4_f0031504.jpg
       ├── 7139_c2_f0160575.jpg
  └── CITATION_DukeMTMC.txt
  └── CITATION_DukeMTMC-reID.txt
  └── LICENSE_DukeMTMC.txt
  └── LICENSE_DukeMTMC-reID.txt
  └── README.md

目录介绍

从视频中每 120 帧采样一张图像,得到了 36,411 张图像。一共有 1,404个人出现在大于两个摄像头下,有 408 个人 (distractor ID) 只出现在一个摄像头下。

1) “bounding_box_test”——用于测试集的 702 人,包含 17,661 张图像(随机采样,702 ID + 408 distractor ID)
2) “bounding_box_train”——用于训练集的 702 人,包含 16,522 张图像(随机采样)
3) “query”——为测试集中的 702 人在每个摄像头中随机选择一张图像作为 query,共有 2,228 张图像

DukeMTMC-attribute数据集标注

Person Re-ID行人重试别数据集
Person Re-ID行人重试别数据集
---------------------

2. 清华大学Market-1501

 Market-1501 数据集在清华大学校园中采集,夏天拍摄,在 2015 年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的,而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

2.1 数据集简介

2.2 目录结构

Market-1501
  ├── bounding_box_test
       ├── 0000_c1s1_000151_01.jpg
       ├── 0000_c1s1_000376_03.jpg
       ├── 0000_c1s1_001051_02.jpg
  ├── bounding_box_train
       ├── 0002_c1s1_000451_03.jpg
       ├── 0002_c1s1_000551_01.jpg
       ├── 0002_c1s1_000801_01.jpg
  ├── gt_bbox
       ├── 0001_c1s1_001051_00.jpg
       ├── 0001_c1s1_009376_00.jpg
       ├── 0001_c2s1_001976_00.jpg
  ├── gt_query
       ├── 0001_c1s1_001051_00_good.mat
       ├── 0001_c1s1_001051_00_junk.mat
  ├── query
       ├── 0001_c1s1_001051_00.jpg
       ├── 0001_c2s1_000301_00.jpg
       ├── 0001_c3s1_000551_00.jpg
  └── readme.txt

2.3 目录介绍

1) “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
2) “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
3) “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
4) “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
5) “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box

2.4 命名规则

以 0001_c1s1_000151_01.jpg 为例:
1) 0001 表示每个人的标签编号,从0001到1501;
2) c1 表示第一个摄像头(camera1),共有6个摄像头;
3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
5) 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

Market-1501_Attribute数据集属性标注

Person Re-ID行人重试别数据集
Person Re-ID行人重试别数据集
---------------------

3. 香港中文大学CUHK03

3.1 数据集简介

CUHK03是第一个足以进行深度学习的大规模行人重识别数据集,该数据集的图像采集于香港中文大学(CUHK)校园。数据以”cuhk-03.mat”的 MAT 文件格式存储,含有 1467 个不同的人物,由 5 对摄像头采集。

3.2 目录结构

CUHK-03
  ├── “detected”── 5 x 1 cell
       ├── 843x10 cell
       ├── 440x10 cell
       ├── 77x10 cell
       ├── 58x10 cell
       ├── 49x10 cell
  ├── “labeled”── 5 x 1 cell
       ├── 843x10 cell
       ├── 440x10 cell
       ├── 77x10 cell
       ├── 58x10 cell
       ├── 49x10 cell
  ├── “testsets”── 20 x 1 cell
       ├── 100 x 2 double matrix

3.3 目录介绍

(1)”detected”—— 5 x 1 cells,由机器标注,每个 cell 中包含一对摄像头组采集的照片,如下所示:
  每个摄像头组由 M x 10 cells 组成,M 为行人索引,前 5 列和后 5 列分别来自同一组的不同摄像头。
  cell 内每个元素为一幅 H x W x 3 的行人框图像(uint8 数据类型),个别图像可能空缺,为空集。
843x10 cell ——> 摄像头组pair 1。
440x10 cell ——> 摄像头组pair 2。
77x10 cell ——> 摄像头组pair 3。
58x10 cell ——> 摄像头组pair 4。
49x10 cell ——> 摄像头组pair 5
(2)”labeled”—— 5 x 1 cells,行人框由人工标注,格式和内容和”detected”相同。
(3)”testsets”—— 20 x 1 cells,测试协议,由 20 个 100 x 2 double 类型矩阵组成 (重复二十次)。
  100 x 2 double,100 行代表 100 个测试样本,第 1 列为摄像头 pair 索引,第 2 列为行人索引。
--------------------------
--------------------------

上一篇:用Java代码通过JDBC连接Hiveserver2


下一篇:ubuntu安装vmplayer出现问题的解决方法