VOC 2012 augment 数据集 data augmentation 10582到底哪来的

根据deeplabv3+官方,train_aug 数据应该有10582.

 

你只需要准备两个文件夹,一个list.txt:

  1. 官方提供的VOC2012的JEPGImages 文件夹(也就是全部的彩色照片)
  2. SBD数据库作者提供的数据扩增标注
  3. 该标注对应的list(复制粘贴)

也就是说,SBD使用的是原始图片,没有平移旋转,所以你不需要下载他们提供的那个1G多压缩包,只需要下个40M标注。

如果你比较多疑,那你就往下看,如果你觉得没问题,那直接下载就好了,顺眼愉快。

一个论文作者做了augment,我们称之为SBD扩充好了。SBD只有2008年以后的图片

SBD数据库图片:http://home.bharathh.info/pubs/codes/SBD/download.html

SBD数据库标注:https://www.dropbox.com/s/oeu149j8qtbs1x0/SegmentationClassAug.zip?dl=0(转换函数本博客有提供

问题是该SBD数据库作者说,图片实际一共train(8000)+val = 11355个。并且如果使用val做测试,只能使用train.txt那么,其他的2000张图片来自于那里?

 

准确来讲SBD的training数据一共8499张。 val =2858

voc2007trainval一共423

voctest一共211

voc2012 train 1464张  val1450

更别说voc2012还有很多是2007的图片

  • VOC 2012用于分割的数据中train+val包含 2007-2011年间的所有数据,test包含2008-2011年间的数据,没有包含07年的是因为07年的test数据已经公开了。

看2012trainval中2007年的数据:

VOC 2012 augment 数据集 data augmentation 10582到底哪来的

正好是632张2007年的图片

所以我们10582的来源只有SBD+VOC2012

SBDtrain(8849)+voc2012train(1464)=9963   10582-9963=619

SBDval(2858)-voc2012(1450)=1403

1403>619

 

我猜测,可能是将一部分的SBDval数据放到了里面,可能觉得SBDval里面还是有一些不属于VOC2012val的。

 

我就是很较真。。。。。。

还有个问题,同名对应的文件相同吗,比如说BSD中图片与VOC中图片重名了,标注一样吗?

经过严谨的考察。使用全部的VOC2012的image,以及上述网站提供的train_aug,segmentationClassAug能够构成必要的没有重复的DA。

有问题请留言

 

 

 

上一篇:怎么把CAD 2013的图纸转换成CAD 2007的版本?


下一篇:几道 C 语言面试题