VOC 2012 augment 数据集 data augmentation 10582到底哪来的

2024-02-19 21:14:22

根据deeplabv3+官方，train_aug 数据应该有10582.

你只需要准备两个文件夹，一个list.txt：

也就是说，SBD使用的是原始图片，没有平移旋转，所以你不需要下载他们提供的那个1G多压缩包，只需要下个40M标注。

如果你比较多疑，那你就往下看，如果你觉得没问题，那直接下载就好了，顺眼愉快。

一个论文作者做了augment，我们称之为SBD扩充好了。SBD只有2008年以后的图片

问题是该SBD数据库作者说，图片实际一共train（8000）+val = 11355个。并且如果使用val做测试，只能使用train.txt那么，其他的2000张图片来自于那里？

准确来讲SBD的training数据一共8499张。 val =2858

voc2007trainval一共423

voctest一共211

voc2012 train 1464张 val1450

更别说voc2012还有很多是2007的图片：

VOC 2012用于分割的数据中train+val包含 2007-2011年间的所有数据，test包含2008-2011年间的数据，没有包含07年的是因为07年的test数据已经公开了。

看2012trainval中2007年的数据：

正好是632张2007年的图片

所以我们10582的来源只有SBD+VOC2012

SBDtrain（8849）+voc2012train（1464）=9963 10582-9963=619

SBDval（2858）-voc2012（1450）=1403

1403>619

我猜测，可能是将一部分的SBDval数据放到了里面，可能觉得SBDval里面还是有一些不属于VOC2012val的。

我就是很较真。。。。。。

还有个问题，同名对应的文件相同吗，比如说BSD中图片与VOC中图片重名了，标注一样吗？

有问题请留言