CNN是一个运用卷积神经网络进行图片分类的开山之作。RCNN是第一个把图片分类和目标检测连接起来的作品。
RCNN主要解决的问题是:
1、怎样用深度神经网络进行目标定位;2、怎样用小批量的标注数据来训练一个大容量网络。
一、检测和分类的区别,就是多了一个框定位。作者的方法是:recognition using regions。
主要分三步:
1、对于一张图片,生成2000个proposal。和种类无关的子图。
2、对于每一个proposal,用CNN单独提取他们的特征。
3、对每一个特征,用SVM来做分类。
二、怎样用小批量标注数据训练大网络
先用大批量的无标注数据进行无监督训练。在此基础上,再用小批量的标注数据进行微调。