【PASCAL& VOC数据集介绍与制作自己的数据集】
文前白话
文章介绍PASCAL& VOC 相关知识,以及VOC 数据集的下载与使用,然后介绍如何使用标注工具,制作自己的数据集和相关的处理,方便进行训练。
1、PASCAL& VOC 挑战赛介绍
(全称:The Pattern Analysis Statical Modeling and Computational Learning Visual Object Classes )是一个世界级的计算机视觉挑战赛,The Pattern Analysis Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCAL& VOC 挑战赛主要的项目范围: 图像分类(Obj_Classification);目标检测(Obj_Detection);目标分割(Obj_Segmentation);动作识别(Action_Classification)等.
Obj_Detection & Obj _Classification
Obj_Segmentation
Action_Classification
2、PASCAL& VOC 数据集如何下载
PASCAL& VOC 官方链接:PASCAL& VOC
3、PASCAL& VOC 数据集介绍
数据集包含的分类类别:
下载的数据集文件结构:
PASCAL& VOC 2007 test数据集公开了
而;PASCAL& VOC 2012 test数据集至今未公开。
4、如何制作自己的数据集
2D标注工具
① labellmg / 生成xml信息文件
具体: github网址了解访问链接.
或者推荐:下载桌面版直接点击使用(个人感觉更方便)
下载桌面版网盘链接:
https://pan.baidu.com/s/1CGkZ82R2aIAz7sKxWmQB0A
提取码:9e5i
labelme / 生成josn文件
更多的可以到 github 上搜索
4.1 使用labelimg标注图片的方法
①打开项目文件夹->data->predefined_classes.txt给定要显示的标注类别信息
②打开软件
③设置图像文件所在目录,以及标注文件保存目录
④标注图像,并保存
⑤若要修改源代码在项目的libs->labelFile.py文件中修改
给出自己的标签种类:
保存xml的文件是自己创建的,保存有每一张图片对应的标签信息
4.2 对标注的数据进行清洗与可视化检查
数据集制作好以后,在训练之前,为了稳妥起见,可以将进行数据清洗与标注信息核查,详细步骤与脚本代码参见博文: 【制作数据集时,用python脚本对标注信息进行数据清洗和可视化】
里面有具体的脚本和使用说明。
Reference
https://www.bilibili.com/video/BV1kV411k7D8