基于深度学习ResNet模型的图像识别

 

开始答辩:

  我们的项目的方向是基于深度学习的图像识别。图像识别可以说是人工智能中相当基础而又相当有应用前景的一门技术。

  计算机的图像识别技术在公共安全、生物、工业、农业、交通、医疗等很多领域都有应用。

例如交通方面的车牌识别系统;公共安全方面的的人脸识别技术、指纹识别技术;农业方面的种子识别技术、食品品质检测技术;医疗方面的心电图识别技术等。随着计算机技术的不断发展,图像识别技术也在不断的优化,其算法也在不断改进。

 

  我们团队利用机器学习中的ResNet模型和现有的cifar10数据库实现了一个图像识别系统,经过我们测试,该系统对图像的准确率高达90%,由于设备的缺乏,使得我们对网络的改进十分缓慢,也十分吃力,达到这个成绩也算是差强人意吧。

  下面我将针对网络模型以及数据集选取这两个方面进行答辩。

  我们使用的网络模型是2015年由三位华人学者提出的ResNet,该模型相比其他网络具有以下几个优点。

 

 基于深度学习ResNet模型的图像识别

 

  引入了深度残差学习框架,相比于让一些堆叠层直接学习原始特征,而是让堆叠层去拟合残差映射。

  ResNet能从增加的深度中获得准确率的提升,Resnet产生的结果也刷新了当时的记录。

  ResNet扩展性强,当网络增加到100层甚至1000层的时候,仍然不会出现退化问题。

  因此这里我们采用该网络实现图像识别技术。

 

  下面我介绍一下cifar10数据集,该数据集是由10个种类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。

  该训练集是由Alex和Ilya整理的一个用于识别普适物体的小型数据集,该训练集具有普适性 和 实用性。因此我们采取该数据集。

  实验之后我们也得到了较好的训练结果。

  基于深度学习ResNet模型的图像识别

 

 

 

  该系统的使用也非常的简便,将图片存储至img文件夹并命名为name.jpg,然后直接运行predict.py程序,就可以得到结果。

  该系统是我们团队的第一个项目,看到结果之后我们欣喜若狂,希望得到大家的认可。

  下面用视频演示一下系统的实测效果。

 

  

  

上一篇:pytorch 修改预训练model


下一篇:ResNeXt:Aggregated Residual Transformations for Deep Neural Networks