根据deeplabv3+官方,train_aug 数据应该有10582.
你只需要准备两个文件夹,一个list.txt:
也就是说,SBD使用的是原始图片,没有平移旋转,所以你不需要下载他们提供的那个1G多压缩包,只需要下个40M标注。
如果你比较多疑,那你就往下看,如果你觉得没问题,那直接下载就好了,顺眼愉快。
一个论文作者做了augment,我们称之为SBD扩充好了。SBD只有2008年以后的图片
SBD数据库图片:http://home.bharathh.info/pubs/codes/SBD/download.html
SBD数据库标注:https://www.dropbox.com/s/oeu149j8qtbs1x0/SegmentationClassAug.zip?dl=0(转换函数本博客有提供)
问题是该SBD数据库作者说,图片实际一共train(8000)+val = 11355个。并且如果使用val做测试,只能使用train.txt那么,其他的2000张图片来自于那里?
准确来讲SBD的training数据一共8499张。 val =2858
voc2007trainval一共423
voctest一共211
voc2012 train 1464张 val1450
更别说voc2012还有很多是2007的图片:
- VOC 2012用于分割的数据中train+val包含 2007-2011年间的所有数据,test包含2008-2011年间的数据,没有包含07年的是因为07年的test数据已经公开了。
看2012trainval中2007年的数据:
正好是632张2007年的图片
所以我们10582的来源只有SBD+VOC2012
SBDtrain(8849)+voc2012train(1464)=9963 10582-9963=619
SBDval(2858)-voc2012(1450)=1403
1403>619
我猜测,可能是将一部分的SBDval数据放到了里面,可能觉得SBDval里面还是有一些不属于VOC2012val的。
我就是很较真。。。。。。
还有个问题,同名对应的文件相同吗,比如说BSD中图片与VOC中图片重名了,标注一样吗?
经过严谨的考察。使用全部的VOC2012的image,以及上述网站提供的train_aug,segmentationClassAug能够构成必要的没有重复的DA。
有问题请留言