计算机视觉中的图像标注工具总结

 本文来自公众号CV技术指南资源分享系列

创建高质量的数据集是任何机器学习项目的关键部分。在实践中,这通常比实际训练和超参数优化花费的时间更长。因此,选择合适的标注工具至关重要。在这里,我们总结了一些用于计算机视觉任务的最佳图像标注工具:labelme、labelImg、CVAT和hasty.ai。

 

作者:Dmitrii

编译:CV技术指南

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读

 

labelme

地址:https://github.com/wkentaro/labelme

计算机视觉中的图像标注工具总结

计算机视觉中的图像标注工具总结

你可以用它做什么

labelme 是一个基于 python 的开源图像多边形标注工具,可用于手动标注图像以进行对象检测、分割和分类。它是在线 LabelMe 的离线分支,最近关闭了新用户注册选项。所以,在这篇文章中,我们只考虑 labelme(小写)。

该工具是具有直观用户界面的轻量级图形应用程序。使用 labelme,您可以创建:多边形、矩形、圆、线、点或线带。

通常,能够以众所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)导出注释以供后续使用通常很方便。但是,在 labelme 中,标签只能直接从应用程序保存为 JSON 文件。如果要使用其他格式,可以使用 labelme 存储库中的 Python 脚本将注释转换为 PASCAL VOL。

尽管如此,它还是一个相当可靠的应用程序,具有用于手动图像标记和广泛的计算机视觉任务的简单功能。

 

安装和配置

labelme 是一个跨平台的应用程序,可以在多个系统上工作,例如 Windows、Ubuntu 或 macOS。安装本身非常简单,这里有很好的描述。例如,在 macOS 上,您需要在终端中运行以下命令:

  1. 安装依赖:brew install pyqt

  2. 安装labelme:pip install labelme

  3. 运行 labelme:labelme

 

labelImg

地址:https://github.com/tzutalin/labelImg

计算机视觉中的图像标注工具总结

计算机视觉中的图像标注工具总结

你可以用它做什么

labelImg 是一种广泛使用的开源图形注释工具。它仅适用于目标定位或检测任务,并且只能在考虑的对象周围创建矩形框。

尽管存在这种限制,我们还是建议使用此工具,因为该应用程序仅专注于创建尽可能简化工具的边界框。对于此任务,labelImg 具有所有必要的功能和方便的键盘快捷键。

另一个优点是您可以以 3 种流行的注释格式保存/加载注释:PASCAL VOC、YOLO 和 CreateML。

 

安装和配置

这里对安装进行了很好的描述。还要注意 labelImg 是一个跨平台的应用程序。例如,对于 MacOS,需要在命令行上执行以下操作:

  1. 安装依赖:先 brew install qt,然后 brew install libxml2

  2. 选择要安装的文件夹的位置。

  3. 当你在文件夹中时,运行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然后 make qt5py3

  4. 运行 labelImg:python3 labelImg.py

  5. 开发人员强烈建议使用 Python 3 或更高版本和 PyQt5。

 

 

CVAT

地址:https://github.com/openvinotoolkit/cvat

计算机视觉中的图像标注工具总结

计算机视觉中的图像标注工具总结

你可以用它做什么

CVAT 是一种用于图像和视频的开源注释工具,用于对象检测、分割和分类等任务。

要使用此工具,您无需在计算机上安装该应用程序。可以在线使用此工具的网络版本。您可以作为一个团队协作处理标记图像并在用户之间分配工作。

还有一个很好的选择,它允许您使用预先训练的模型来自动标记您的数据,如果您使用 CVAT 仪表板中现有的可用模型,这可以简化最流行的类(例如,COCO 中包含的类)的过程。或者,您也可以使用自己的预训练模型。

CVAT 具有我们已经考虑过的工具中最广泛的功能集。特别是,它允许您以大约 15 种不同的格式保存标签。可以在此处找到完整的格式列表。

 

 

hasty.ai

地址:https://hasty.ai/

计算机视觉中的图像标注工具总结

计算机视觉中的图像标注工具总结

你可以用它做什么

与上述所有工具不同,hasty.ai 不是免费的开源服务,但由于所谓的对象检测和分割的 AI 助手,它非常方便地标记数据。自动支持允许您显着加快注释过程,因为在标记期间辅助模型正在训练。换句话说,标记的图像越多,助手的工作就越准确。我们将在下面看一个例子来说明它是如何工作的。您也可以免费试用此服务。该试验提供 3000 积分,足以为一个物体检测任务自动生成大约 3000 个物体的建议标签。hasty.ai 允许您以 COCO 或 Pascal VOC 格式导出数据。您还可以作为一个团队处理单个项目并在项目设置中分配角色。免费积分用完后,hasty.ai 仍然可以免费使用,但标记将完全由手动操作。在这种情况下,最好考虑上述免费工具。

配置

  1. 要使用该工具,您需要在 hasty.ai 上注册。

  2. 登录您的帐户。

  3. 单击创建新项目。

  4. 用名称和描述填写表单并导航到项目设置,您可以在其中定义考虑中的类,为该项目添加数据。

  5. 此外,您可以添加其他用户来共同处理项目。积分将从共享项目的用户的帐户中使用。

 

原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796

 

欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

在公众号中回复关键字 “技术总结”可获取公众号原创技术总结文章的汇总pdf。

计算机视觉中的图像标注工具总结计算机视觉中的图像标注工具总结

其它文章

CV技术指南--精华文章汇总分类

神经网络超参数的调参方法总结

轻量化模型系列--GhostNet:廉价操作生成更多特征

ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别

CVPR2021 | 重新思考BatchNorm中的Batch

ICCV2021 | 重新思考视觉transformers的空间维度

CVPR2021 | Transformer用于End-to-End视频实例分割

ICCV2021 |(腾讯优图)重新思考人群中的计数和定位:一个纯粹基于点的框架

卷积神经网络的复杂度分析

2021年小目标检测最新研究综述

计算机视觉中的自注意力

综述专栏 | 姿态估计综述

漫谈CUDA优化

为什么GEMM是深度学习的核心

使用深度神经网络为什么8位足够?

经典论文系列--胶囊网络:新的深度学习网络

经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷

如何看待人工智能的泡沫

使用Dice loss实现清晰的边界检测

PVT--无卷积密集预测的多功能backbone

CVPR2021 | 开放世界的目标检测

Siamese network总结

视觉目标检测和识别之过去,现在及可能

在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进?

计算机视觉专业术语总结(一)构建计算机视觉的知识体系

欠拟合与过拟合技术总结

归一化方法总结

论文创新的常见思路总结

CV方向的高效阅读英文文献方法总结

计算机视觉中的小样本学习综述   

知识蒸馏的简要概述    

计算机视觉中的特征金字塔技术总结

Siamese network总结

计算机视觉中的注意力机制技术总结

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

计算机视觉专业术语总结(一)构建计算机视觉的知识体系

北京大学施柏鑫:从审稿人视角,谈谈怎么写一篇CVPR论文

归一化方法总结

计算机视觉的高效阅读英文文献方法总结

计算机视觉中的小样本学习综述

知识蒸馏的简要概述

损失函数技术总结

CVPR2021 | 开放世界的目标检测

CVPR2021|PVT--无卷积密集预测的多功能backbone

CVPR2021|特征金字塔的新方式YOLOF

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer

CVPR2021| 继SE,CBAM后的一种新的注意力机制Coordinate Attention

经典论文系列 | 重新思考在ImageNet上的预训练

上一篇:YOLO


下一篇:复制带有随机指针节点的链表