学习内容:SSD(ECCV 2016)
- 概述:
- 预选框的产生:prior box(与anchor类似)
- 以feature map上的每个像素点(可看作一个小框)的中心点为中心,生成四个同心的框,两个正方形(分为最小和最大,边长由公式决定),两个矩形框(长宽由两个正方形边长和预设纵横比决定)
-
网络:在VGG16的基础上,用卷积层换掉原有的FC,去掉了dropout,新增了多个卷积层
-
损失函数:
- 分类:使用softmax交叉熵损失函数
- 边框回归:bbox回归(同RCNN)
-
匹配
-
数据增强
-
总结:
- 实现了端到端(?);容易和backbone net融合;用了多尺度的特征图提取特征
- 小目标检测不好,预选框需要手动调节