Read Data: 0901 |
Publication: CVPR 2021 |
||
Title: Dense Relation Distillation with Context-aware Aggregation for Few-Shot Object Detection |
|||
Aim: 解决小样本对大量标注的依赖性。 当标记数据变得稀缺时,cnn会严重过拟合而不能泛化。 现有的小样本学习工作大多集中在图像分类问题上,只有少数集中在小样本目标检测问题上。由于目标检测不仅需要分类预测,还需要对目标进行定位,比分类任务困难得多。 |
Research Question: 首先,在以往的小样本检测工作中,支持特征与查询特征之间的关系难以充分挖掘,大多采用对支持特征进行全局池操作来调制查询分支,容易丢失详细的局部上下文。其次,尽管尺度变化问题在以往的工作中得到了广泛的研究,但它仍然是小样本检测任务中的一个严重障碍。在小样本设置下,具有尺度感知修改的特征提取器倾向于过拟合,导致基类和新类性能下降。 |
||
Method: 首先提出稠密关系蒸馏模块,充分利用支持集。在给定查询图像和支持图像的基础上,共享特征学习器提取查询特征和支持特征进行匹配。直观上,判断查询对象和支持对象是否属于同一类别的标准主要是衡量它们具有多少共同的特征相似度。当出现外观变化或遮挡时,局部细节特征在匹配候选对象和模板对象时占主导地位。因此,我们提出了一种稠密关系蒸馏机制,其中查询和支持特征在像素级进行匹配,而不是获取支持集的全局表示。具体来说,键和值映射由特征生成,分别作为编码视觉语义用于匹配,包含详细的外观信息用于解码。通过有效地检索支持集的本地信息来指导,性能可以显著提高,特别是在极低命中率的场景中。 此外,为了缓解尺度变化的问题,我们设计了上下文感知的特征聚合模块,在RoI池中捕捉不同尺度的关键线索。由于直接修改特征提取器可能会导致过拟合,我们选择从更灵活的角度进行调整。识别不同尺度的对象需要不同层次的上下文信息,固定的池化分辨率会导致大量的上下文信息丢失。因此,一个自适应的聚合机制,将特定的注意力同时分配到局部和全局特征,可以帮助保存不同尺度的对象的上下文信息。因此,我们不是使用一个固定的分辨率执行RoI池,而是选择三个不同的池分辨率来捕获更丰富的上下文特性。然后引入注意机制,自适应聚合输出特征,以提供更全面的表征。 |
|||
Results: 实验表明,在小样本设置中,我们的方法在第1组和第3组中比其他方法高出约10%,提供了令人信服的证据,证明我们的DCNet能够捕获局部详细信息,以克服随机抽样训练带来的变化。 |
Discussion: |
||
Conclusion: 1. 针对少镜头检测问题,提出了一种密集关系提取模块,旨在充分利用支持信息来辅助新类目标的检测过程。2. 我们提出了一个自适应上下文感知的特征聚合模块,以更好地捕获全局和局部特征,缓解尺度变化问题,提高少镜头检测的性能。3.大量的实验表明,我们的方法在PASCAL VOC和MS COCO数据集上取得了一致的改进。特别地,我们的方法在两个数据集上取得了比目前最先进的方法更好的性能 |
Further: 。 |
||
Ref: |