【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

PAI平台深度学习Caffe框架实现图像分类的模型训练

背景

我们在之前的文章中介绍过如何通过PAI内置的TensorFlow框架实验基于Cifar10的图像分类,文章链接:https://yq.aliyun.com/articles/72841。使用Tensorflow做深度学习做深度学习的网络搭建和训练需要通过PYTHON代码才能使用,对于不太会写代码的同学还是有一定的使用门槛的。本文将介绍另一个深度学习框架Caffe,通过Caffe只需要填写一些配置文件就可以实现图像分类的模型训练。
关于PAI的深度学习功能开通,请务必提前阅读https://help.aliyun.com/document_detail/49571.html
文末提供了相关下载链接。

数据介绍

本文使用的数据是开源数据集cifar10,这份数据是一份对包含6万张像素为32*32的彩色图片,这6万张图片被分成10个类别,分别是飞机、汽车、鸟、毛、鹿、狗、青蛙、马、船、卡车。数据集截图:
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

目前这份数据已经内置在PAI提供的公共数据集中,以jpg格式存储。任何PAI的用户都可以在深度学习组件的数据源OSS路径中直接输入,

  • 测试数据: oss://dl-images.oss-cn-shanghai-internal.aliyuncs.com/cifar10/caffe/images/cifar10_test_image_list.txt
  • 训练数据:oss://dl-images.oss-cn-shanghai-internal.aliyuncs.com/cifar10/caffe/images/cifar10_train_image_list.txt

如图:
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

格式转换

目前PAI上的Caffe框架只支持特定的格式,所以需要首先将jpg格式的图片进行格式转换。
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

经过格式转换,可以在自己的OSS路径下生成如下文件,训练数据和测试数据各一份。
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

需要记录对应的OSS路径用于net文件的填写,路径由两部分组成 {bucket_name}/{file_path},第一部分是bucket的名字,第二部分是文件路径。假设路径名分别是:

  • 训练数据data_file_list.txt:bucket/cifar/train/data_file_list.txt
  • 训练数据data_mean.binaryproto:bucket/cifar/train/data_mean.binaryproto
  • 测试数据data_file_list.txt:bucket/cifar/test/data_file_list.txt
  • 测试数据data_mean.binaryproto:bucket/cifar/test/data_mean.binaryproto

Caffe配置文件

Net文件编写,对应上文格式转换生成的路径:
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

Solver文件编写:
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

运行

将编辑好的Solver文件和Net文件全部传到OSS上,拖动caffe训练组件如图,在Sovler文件路径上选择OSS上提交的Solver文件,运行即可。
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

生成的图片分类model文件可以在OSS对应路径下查看,可以用以下模型进行图片分类
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

日志查看可以参照本文开头提供的“Tensorflow实现图像分类”。

往期文章

【玩转数据系列十一】机器学习PAI眼中的《人民的名义》

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

【玩转数据系列九】机器学习为您解密雾霾形成原因

【玩转数据系列八】机器学习算法的离线调度实现-广告CTR预测

【玩转数据系列七】有娃的注意了,机器学习教您如何提高孩子学习成绩

【玩转数据系列六】文本分析算法实现新闻自动分类

【玩转数据系列五】农业贷款发放预测

【玩转数据系列四】听说啤酒和尿布很配?本期教你用协同过滤做推荐

【玩转数据系列三】利用图算法实现金融行业风控

【玩转数据系列二】机器学习应用没那么难,这次教你玩心脏病预测

【玩转数据系列一】人口普查统计案例

其它

代码下载:http://docs-aliyun.cn-hangzhou.oss.aliyun-inc.com/assets/attach/52239/cn_zh/1496736657170/Caffe_cifar10.zip?spm=5176.doc52239.2.2.tMrTgQ&file=Caffe_cifar10.zip

参与讨论:云栖社区公众号

免费体验:阿里云数加机器学习平台

作者微信公众号(与作者讨论):
【玩转数据系列十二】PAI平台深度学习Caffe框架实现图像分类的模型训练

上一篇:Kubernetes进阶学习之集群升级迁移和维护实践


下一篇:OSI七层模型和TCP/IP参考模型