文章目录
FiftyOne——图像数据集的开源工具
引言
FiftyOne这个工具比较新,是VOXEL51最新开发的一个数据集工具,同时也受Coco数据集团队支持。旨在加快机器学习中涉及图像数据集方面的研究。其主要功能有
这部分不严谨,待完善。先上后面的操作
1、下载现有的经典数据集,如coco和谷歌open dataset等大型数据集,并提供了依照类别(如 dog 、cat、person)、任务类型(如目标检测,图像分类,语义分割等)等下载所需的子集。
2、可视化图像和标签,并可以根据条件(如标签等)筛选可视化的图像类型
3、模型评估。
4、分析、评估现有数据集的质量。
安装
系统环境:Win10
该开源工具是基于Python语言的。安装的过程也比较简单。
pip install fiftyone
也可以下载桌面版,桌面版的效果还没有试过
pip install fiftyone-desktop
示范下载初步数据集
测试代码,大概的意思是从网上现下一个小的数据库,并做显示演示:
import fiftyone as fo
import fiftyone.zoo as foz
dataset = foz.load_zoo_dataset("quickstart")
session = fo.launch_app(dataset,port = 5151) # 没有指定port则默则5151
session.wait() # 官网给的示例没有这一句,记得加上,不然程序不会等待,在网页中看不到我们要的效果
数据库下载中
下载后完成后显示让你访问网页,默认会自动弹出:
网页显示的效果是这样的:
问题
据官网所说,大部分问题可以通过更新一些包来解决,具体操作如下两行代码
pip install --upgrade pip setuptools wheel
pip install fiftyone
但是我运动第一行代码的时候,发现他把我原本的pip给卸载了,但是没有成功安装上新的pip。
因此需要用其它的代码来重新安装下pip,具体如下
python -m ensurepip
python -m pip install --upgrade pip
1 AttributeError: type object ‘MongoClient’ has no attribute ‘topology_description’
问题截图:
措施1:更新下其它的依赖库,然后再安装一次
pip install --upgrade pip setuptools wheel
pip install fiftyone
可以看到自动更新了pymogo这个包
2 测试时显示访问超时
案例说这应该是不能访问谷歌网盘引起的,但不知道为什么在使用了VPN的时候出现”ValueError: check_hostname requires server_hostname“错误后,我更新了”urllib3“库。突然这边也就好使了。 建议遇到这个问题先不要用vpn,直接更新下”urllib3“的库。
测试代码:
import fiftyone as fo
import fiftyone.zoo as foz
dataset = foz.load_zoo_dataset("quickstart")
session = fo.launch_app(dataset)
session.wait() # 官网给的示例没有这一句,记得加上,不然程序不会等待,在网页中看不到我们要的效果
更新代码如下
pip install urllib3==1.25.11
3 ValueError: check_hostname requires server_hostname
使用VPN出现上述问题
参考出处
更新下下库的版本
pip install urllib3==1.25.11