基础的图像分类自己遇到的一些坑
https://aistudio.baidu.com/aistudio/course/introduce/11939?directly=1&shared=1
研究生刚刚入门计算机视觉领域,参加了飞桨举办的图像分类课程。
在这个课程的学习中学会了使用ai studio学习平台上如何上传并运用数据集,其步骤为首先点击首页上的数据集,然后点击创建数据集上传数据集,点击确定,然后点击项目,如果在已有项目中添加数据集,点击我的项目;如果是想创建新项目,点击创建项目。
在神经网络的学习中,学会了如何运用paddle框架构建神经网络,其编程过程相比于其他框架要简单的多,在解压数据集的过程中文件解压(https://www.icode9.com/i/ll/?i=20210310173444362.PNG#pic_center),在文件解压部分应按照相应的路径进行解压。
数据处理这里要看懂代码的思路,我们从解压后的数据集知道,里面有train的标注好的csv文件,而test是没有的,所以将train的数据集按8:2划分为训练集和验证集,csv文件里只有名称'id'和类别'class_num'的信息。
数据处理的步骤:
1.读取全部train的名称'id'和类别'class_num'的信息
2.打乱顺序,要记住一件事,我们对图片的读取处理,都是通过路径加图片名称来获得的。
3.划分数据集
4.数据预处理,也就是数据增广。
5.构建dataset。
进行完数据预处理就是构建神经网络,这里的神经网络是直接调用库里存在的,并没有进行神经网络的构建。
将调用的模型在数据集上训练完成后进行模型保存。
接下来就是模型的预测,模型的预测是在测试集上进行的(切记!!!),训练集上的验证集不具备参考价值。
具体的代码请参考本人在ai studio平台上书写的代码
https://aistudio.baidu.com/aistudio/projectdetail/1639011