参考视频教程:
**深度学习之目标检测常用算法原理+实践精讲 **
Two-stage核心组件
一、Two-stage的两个核心组件
- CNN网络(主干网络)
- RPN网络
二、CNN网络设计原则
- 从简到繁再到简的卷积神经网络
- 多尺度特征融合的网络
- 更轻量级的CNN网络
三、RPN网络
- 区域推荐(Anchor机制)
- ROI Pooling
- 分类和回归
区域推荐(Anchor机制)
假设当前的feature map的大小为[n, c, w, h],选择当前w*h大小的feature map上的每个点来作为一个锚点,也就是候选区域的中心点(称之为anchor),以每一个中心点来提取候选区域,候选区域通常会按照一定的比例去提取,对于Fast RCNN,有9个不同的尺度去提取,而对于整个w*h大小的feature map,我们会提取w*h*9个候选区域,然后通过真值对候选区域进行筛选,通过IOU来筛选候选区域,得到正样本(包含目标对象的区域)和负样本(不包含目标对象的区域),也就是如果真值和候选区域的重叠面积超过了0.7则为正样本,小于0.3为负样本,这里的0.7和0.3都是超参,可自行设定
ROI Pooling
- 输入:特征图、rois(1x5x1x1)以及ROI参数
- 输出:固定尺寸的feature map