1.下载
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
2.20个类别
3.文件结构,目标检测主要用到imagesets-main
4.看看每个图像的xml
#固定
<annotaion>
<folder>父文件夹名</folder>
<filename><filename>
<source>
<database>来自什么数据集</database>
<annotaion>标注信息来源于</annotation>
<image>图片来源</image>
</source>
<size>
<width></width>
<height></height>
<depth></depth>
<size>
<segmented>有没有被分割锅,有就用1表示</segmented>
<object>#目标检测的物体
<name>是什么物体</name>
<pose></pose>#这个用不到
<truncated>目标有没有被截断,比如在图像的边界</truncated>
<difficult>目标检测的难易程度</difficult>
<bndbox>#物体检测框的坐标
<xmin></xmin>
<ymin><ymin>
<xmanx>
<ymax>
</bndbox>
<object>
5.main里面除了train,val,trainval,还有争对某个物体的txt
-1表示没有boat,0表示很难检测
2.标准软件labelimg使用
1.在anaconda直接创建的环境中使用pip install labelimg
2.使用前创建
an里面是放标注后的,image就是原图,class。txt就是类别
3.在这个文件夹下运行anaconda 激活环境,
使用命令
labelimg ./image ./class.txt
标注后存放的文件夹
点击可以标注shi
是否识别困难