本文来自公众号CV技术指南资源分享系列
创建高质量的数据集是任何机器学习项目的关键部分。在实践中,这通常比实际训练和超参数优化花费的时间更长。因此,选择合适的标注工具至关重要。在这里,我们总结了一些用于计算机视觉任务的最佳图像标注工具:labelme、labelImg、CVAT和hasty.ai。
作者:Dmitrii
编译:CV技术指南
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
labelme
地址:https://github.com/wkentaro/labelme
你可以用它做什么
labelme 是一个基于 python 的开源图像多边形标注工具,可用于手动标注图像以进行对象检测、分割和分类。它是在线 LabelMe 的离线分支,最近关闭了新用户注册选项。所以,在这篇文章中,我们只考虑 labelme(小写)。
该工具是具有直观用户界面的轻量级图形应用程序。使用 labelme,您可以创建:多边形、矩形、圆、线、点或线带。
通常,能够以众所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)导出注释以供后续使用通常很方便。但是,在 labelme 中,标签只能直接从应用程序保存为 JSON 文件。如果要使用其他格式,可以使用 labelme 存储库中的 Python 脚本将注释转换为 PASCAL VOL。
尽管如此,它还是一个相当可靠的应用程序,具有用于手动图像标记和广泛的计算机视觉任务的简单功能。
安装和配置
labelme 是一个跨平台的应用程序,可以在多个系统上工作,例如 Windows、Ubuntu 或 macOS。安装本身非常简单,这里有很好的描述。例如,在 macOS 上,您需要在终端中运行以下命令:
-
安装依赖:brew install pyqt
-
安装labelme:pip install labelme
-
运行 labelme:labelme
labelImg
地址:https://github.com/tzutalin/labelImg
你可以用它做什么
labelImg 是一种广泛使用的开源图形注释工具。它仅适用于目标定位或检测任务,并且只能在考虑的对象周围创建矩形框。
尽管存在这种限制,我们还是建议使用此工具,因为该应用程序仅专注于创建尽可能简化工具的边界框。对于此任务,labelImg 具有所有必要的功能和方便的键盘快捷键。
另一个优点是您可以以 3 种流行的注释格式保存/加载注释:PASCAL VOC、YOLO 和 CreateML。
安装和配置
这里对安装进行了很好的描述。还要注意 labelImg 是一个跨平台的应用程序。例如,对于 MacOS,需要在命令行上执行以下操作:
-
安装依赖:先 brew install qt,然后 brew install libxml2
-
选择要安装的文件夹的位置。
-
当你在文件夹中时,运行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然后 make qt5py3
-
运行 labelImg:python3 labelImg.py
-
开发人员强烈建议使用 Python 3 或更高版本和 PyQt5。
CVAT
地址:https://github.com/openvinotoolkit/cvat
你可以用它做什么
CVAT 是一种用于图像和视频的开源注释工具,用于对象检测、分割和分类等任务。
要使用此工具,您无需在计算机上安装该应用程序。可以在线使用此工具的网络版本。您可以作为一个团队协作处理标记图像并在用户之间分配工作。
还有一个很好的选择,它允许您使用预先训练的模型来自动标记您的数据,如果您使用 CVAT 仪表板中现有的可用模型,这可以简化最流行的类(例如,COCO 中包含的类)的过程。或者,您也可以使用自己的预训练模型。
CVAT 具有我们已经考虑过的工具中最广泛的功能集。特别是,它允许您以大约 15 种不同的格式保存标签。可以在此处找到完整的格式列表。
hasty.ai
地址:https://hasty.ai/
你可以用它做什么
与上述所有工具不同,hasty.ai 不是免费的开源服务,但由于所谓的对象检测和分割的 AI 助手,它非常方便地标记数据。自动支持允许您显着加快注释过程,因为在标记期间辅助模型正在训练。换句话说,标记的图像越多,助手的工作就越准确。我们将在下面看一个例子来说明它是如何工作的。您也可以免费试用此服务。该试验提供 3000 积分,足以为一个物体检测任务自动生成大约 3000 个物体的建议标签。hasty.ai 允许您以 COCO 或 Pascal VOC 格式导出数据。您还可以作为一个团队处理单个项目并在项目设置中分配角色。免费积分用完后,hasty.ai 仍然可以免费使用,但标记将完全由手动操作。在这种情况下,最好考虑上述免费工具。
配置
-
要使用该工具,您需要在 hasty.ai 上注册。
-
登录您的帐户。
-
单击创建新项目。
-
用名称和描述填写表单并导航到项目设置,您可以在其中定义考虑中的类,为该项目添加数据。
-
此外,您可以添加其他用户来共同处理项目。积分将从共享项目的用户的帐户中使用。
原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
在公众号中回复关键字 “技术总结”可获取公众号原创技术总结文章的汇总pdf。
其它文章
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别
CVPR2021 | 重新思考BatchNorm中的Batch
ICCV2021 | 重新思考视觉transformers的空间维度
CVPR2021 | Transformer用于End-to-End视频实例分割
ICCV2021 |(腾讯优图)重新思考人群中的计数和定位:一个纯粹基于点的框架
经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷
在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进?
文字识别OCR开源框架的对比--Tesseract vs EasyOCR
CVPR2021|PVT--无卷积密集预测的多功能backbone
CVPR2021 | 华为诺亚实验室提出Transformer in Transformer
CVPR2021| 继SE,CBAM后的一种新的注意力机制Coordinate Attention