【论文阅读】Learning High-Precision Bounding Box for Rotated Object Detection via Kullback-Leibler Diverge

旋转目标检测方法解读(KLD, NeurIPS2021)

旋转目标检测方法解读(KLD, NeurIPS2021) - 知乎

Learning High-Precision Bounding Box for Rotated Object Detection via Kullback-Leibler Diverge

通过Kullback-Leibler Divergence学习旋转目标检测的高精度包围盒

摘要

        现有的旋转目标探测器大多继承了水平探测范式,后者已经发展成为一个成熟的领域。然而,由于现有的回归损耗设计的限制,这些探测器很难在高精度检测中表现突出,特别是对于大纵横比的物体。本文从水平检测是旋转目标检测的特殊情况出发,针对旋转与水平检测的关系,将旋转回归损失的设计从归纳范式改为演绎方法。结果表明,在旋转回归损失中,耦合参数的调制是一个关键的挑战,因为在动态联合优化过程中,估计的参数会以一种自适应和协同的方式相互影响。具体来说,我们首先将旋转的包围盒转换成二维高斯分布,然后计算高斯分布之间的Kullback-Leibler Divergence (KLD)作为回归损失。通过对各参数梯度的分析,表明KLD(及其导数)可以根据物体的特性动态地调整参数梯度。它将根据长宽比调整角度参数的重要性(梯度权重)。这种机制对于高精度检测是至关重要的,因为对于大纵横比的物体,微小的角度误差会导致严重的精度下降。更重要的是,我们已经证明了KLD是尺度不变的。我们进一步证明,KLD损耗可以退化为水平检测的普通范数损耗。在7个数据集上使用不同的检测器进行了实验,结果表明该方法具有一致性的优势,代码可通过http://github.com/yangxue0827/RotationDetection获取。

5 结论

局限性。尽管有理论基础和有前景的实验证明,我们的方法有一个明显的局限性,不能直接应用于四边形检测[33,44]。

潜在的负面社会影响。我们的发现为高精度旋转检测提供了一个简单的回归损失。然而,我们的研究可能会应用到一些敏感领域,如遥感、航空和无人机。

结论。本文从现有的大量目标检测文献出发,从零开始设计了一种新的旋转检测回归损失算法,并将流行的水平检测作为其特例。具体地,我们计算旋转包围盒对应的高斯分布之间的KLD作为回归损失,我们发现在KLD损失指导的学习过程中,参数的梯度可以根据目标的特性动态调整,这是鲁棒目标检测所需要的特性,无论其旋转、大小和宽高比等。我们还证明了KLD具有尺度不变性,这对检测任务至关重要。有趣的是,我们已经证明,在水平检测任务中,KLD可以退化为目前常用的ln-范数ln-norm损失。在不同探测器和数据集上的大量实验结果表明了我们方法的有效性。

上一篇:深度学习经典论文(七)R-CNN


下一篇:Python 20行代码检测人脸是否佩戴口罩