基于BML平台实现目标检测数据集的智能标注
最近发现了一个全功能AI开发平台,叫做BML(Baidu Machine Learning),这是一个面向企业和个人开发者的机器学习集成开发环境,为经典机器学习和深度学习提供了从数据处理、模型训练、模型管理到模型推理的全生命周期管理服务。
BML全功能AI开发平台官网链接:https://ai.baidu.com/bml/
我们在使用一些标注工具的时候,需要自己一张一张的去进行标注,需要花费大量的人力和时间才能将一个大数据集标注完成,为了解决这个问题BML平台推出了智能标注工具,只需要我们在平台进行少量的标注,后边的标注即可使用”智能标注“,自动进行标注,大大减少了我们标注的时间!
一、新建目标检测数据集
第一步:进入BML平台:https://ai.baidu.com/bml/
第二步:点击“立即使用”,在出现的界面中点击“数据总览”或者是"数据集":
第三步:在我的数据总览里点击“创建数据集”
第四步:输入"数据集名称"
第五步:数据集创建完成后,点击完成,可以在数据总览处看到刚刚新建的数据集:
第六步:点击“导入”,将下载好的数据集导入BML平台:
第七步:选择"上传方式",将数据上传
这里我们选择无标注信息,用平台进行智能标注。
压缩包格式:
点击"确定并返回"等待数据集导入
第八步:点击“查看与标注”,可查看数据集的基本概况:
本次数据集总共有200张图片,我自己已经手动标注了96张,其中有104张数据集还未标注,剩下的使用BML平台的"智能标注"!
二、智能标注注意事项
智能标注功能可通过系统自动筛选出数据集中难例图片(最关键需优先标注的图片),用户只需标注数据集30%左右的难例数据即可训练模型,以减少数据标注的人力投入。
三、开始标注
第一步:点击图片中的"编辑",开始标注
第二步:点击"添加标签"
我们添加了2个种类分别为螺丝和螺母
第三步:选择"连续标注",
第四步:开始标注
标注完一个种类,就开始标注第二个种类,以此类推~
当你标注完一个种类之后,可以退出标注模式,或者是切换你的标签进行其他种类标注。
标注结束:
可以看到我们各个标签的个数。
目前已经符合智能标注标准,接下来让我们开始智能标注吧。
三、开始智能标注
点击右上角的“开启智能标注”,:
任务类型分为”主动学习“和”指定模型“,在这里我们使用”主动学习“进行操作
点击”提交“开启智能标注
第一轮难例筛选开始
这时候我们需要耐心等待即可。
第一轮难例筛选结束
第一步、点击智能标注,再点击确认难例
这时候我们可以对难例进行查看和确认
总共分为四个阶段,当前您处于第1轮难例阶段(共4轮),当预计时间结束后
1、修改标注后,您可通过点击【保存当前标注】按钮或翻页完成保存,支持您对标注修改后再保存
2、您只有对【待确认标注】下所有预标注结果完成确认,所有难例均升级为已标状态,才可进入下一阶段
并提供了两种确认方式,分别为单个保存标注和一键保存所有标注。
保存完成之后我们*选择是否进行第二轮,若感觉效果可以了,则可以点击自动标注未标图片,结束智能标注操作,如果效果还是不太行,则进行第二轮难例筛选。
第二轮难例筛选开始
这时候我们需要耐心等待即可。
这时候我们可以看到状态为运行中。
也可以查看进度
第二轮难例筛选结束
第一步:点击"确认难例"
第二步:“查看效果"并"保存标注”
标注结束
我不在演示后续两轮的难例筛选,目前效果已经可以了,这时点击"自动标注未标图片"即可完成标注
四、总结
我们都知道标注需要多大的时间和人力,才能把这件事情做完,BML平台的智能标注操作真的是让我省去了很多的时间,从一个一个标注,变成了标注百分之30%,其余的让机器进行标注,直接省去我三分之二的时间,BML平台的智能标注真的是太强了!!!!
这次体验真的是太棒了,BML平台真正的减少了我们的代码量,几乎做到了0代码,标注也让时间减少了百分之70,还有很多其他的功能,后续也要进行实验!!!