SSP-Net TPAMI2014
一、优缺点
优点:
1.不用像R-CNN一样,对于每一个region proposal 都提取一遍特征,而是一整张图片放进去提取特征。在conv5层输出提取的所有region proposal 的特征,节省了大量的特征。
2.引入了空间金字塔池化,使得在不同尺度的特征上提取一个特征,然后映射到尺寸固定的全连接层上。
缺点:
1.需要存储大量的特征,region proposal对应的特征
2.依然和R-CNN一样是多阶段训练的,先是特征提取,然后用SVM分类以及对Bounding box回归
3.训练时间长(25.5小时)
二、过程
1.对于一整张图片的输入,先做卷积,提取了conv5层的特征,Select Search找到图片上的region proposal,然后对应到Con5提取的特征上。
2.对于region proposal对应的不同尺度的特征首先输入到SPP层得到一个相同大小的输出
3.对SPP层输出的特征去做分类以及回归操作。
三、空间金字塔:对于不同尺度的输入,输出一个相同尺度的特征
对于不同特征的输入,引入空间金字塔池化层,对特征进行了一个44,22,1*1网格的划分,然后对于每一个网格分别进行最大池化操作,把不同网格池化之后的特征进行了拼接,因此,可以得到16+4+1=21维的一个特征的输出。
四、训练过程