阿刚讲RCNN--RCNN

RCNN

  • 2014年提出R-CNN网络,该网络不再使用暴力穷举的方法,而是使用候选区域方法(region proposal method)创建目标检测的区域来完成目标检测的任务,R-CNN是以深度神经网络为基础的目标检测的模型 ,以R-CNN为基点,后续的Fast R-CNN、Faster R-CNN模型都延续了这种目标检测思路。

算法流程

  • 候选区域生成:使用选择性搜索(Selective Search)的方法找出图片中可能存在目标的侯选区域
  • CNN网络提取特征:选取预训练卷积神经网网络(AlexNet或VGG)用于进行特征提取。
  • 目标分类:训练支持向量机(SVM)来辨别目标物体和背景,对每个类别,都要训练一个二元SVM。
  • 目标定位:训练一个线性回归模型,为每个辨识到的物体生成更精确的边界框。

算法总结

  • 训练阶段多,训练耗时: 微调CNN网络+训练SVM+训练边框回归器。

  • 预测速度慢: 使用GPU, VGG16模型处理一张图像需要47s。

  • 占用磁盘空间大:5000张图像产生几百G的特征文件。

  • 数据的形状变化:候选区域要经过缩放来固定大小,无法保证目标的不变形

Ref

itcastAI7期系列课程

阿刚讲RCNN--RCNN
阿刚讲RCNN--RCNN

上一篇:解决NSTimer存在的内存泄漏的问题


下一篇:DNN、CNN、RNN的区别