Deep Anatomical Context Feature Learning for Cephalometric Landmark Detection
深度解剖上下文特征学习的头测量地标检测
来源:10.1109/JBHI.2020.3002582
作者:
附:百度学术 | MICCAI论文摘要2019 |
摘要
近十年来,解剖背景特征已被广泛应用于头位测量标志的检测,目前仍有较大进展。然而,大多数现有的方法依赖于手工制作的图形模型,而不是在训练过程中结合解剖上下文,导致性能不佳。在本研究中,我们提出了一个新的框架,允许卷积神经网络(CNN)在训练过程中学习更丰富的解剖上下文特征。我们的关键思想包括局部特征扰动(LFP)和解剖上下文丢失(AC丢失)。当训练CNN时,LFP扰动基于先前解剖分布的头影测量图像,迫使CNN更全面地注视相关特征。然后AC loss帮助CNN根据地标之间的空间关系来了解解剖上下文。实验结果表明,该框架使CNN学习到更丰富的解剖表示,从而提高了性能。在性能比较中,该方案优于ISBI 2015头影x射线图像分析挑战中最先进的方法。
关键词:头影标记检测,上下文特征学习,全卷积网络。
1、介绍
在正畸和正颌外科的治疗计划中,标记侧头位影像的解剖标志是一项重要的任务。Rokasiet al.[1]提出了90个标志,矫正医师广泛接受其中19个用于各种临床目的。医生手工打标是一项费时费力、易出错的工作。据报道,一位有经验的医生花了大约20分钟来记录19个地标[2]。另一个困难来自主观判断,即人与人之间的高度差异[3]。
认识到自动地标检测的重要性,在2014年和2015年举行的IEEE国际生物医学成像研讨会上提出了巨大的挑战,与会者解决了从侧位颅脑图中自动检测19个地标的问题。在挑战中,提出了各种方案中基于机器学习的地标检测系统,并根据其检测精度进行排序。关于这两个挑战的摘要报告,我们推荐读者到[4],[5]。
近年来,深度学习方法[6]-[9]检测标志物的性能优于其他经典机器学习方法[10]-[17],而基于全卷积网络[18]的热图回归方法[7]、[8]取得了显著的成功。大多数以前的方法通常遵循两个连续的阶段。在第一阶段,在产生区域建议后,他们通过调查局部的头颅图模式来找到标志性的候选区域。在第二阶段,手工制作的图形模型通过考虑解剖上下文的先验知识来微调地标位置,以提高准确性。这种方法需要额外的手工功能设计,因此与端到端学习相距甚远;结果在很大程度上依赖于初始局部特征分析的质量。此外,由于每个区域提议都需要独立地向前执行,因此非常耗时。虽然现有的方法取得了显著的进展,但在训练过程中缺乏联合学习解剖上下文特征仍然存在局限性,导致结果不理想。
我们假设在网络训练过程中同时考虑局部特征和解剖背景,深度学习能产生更好的泛化效果。本文提出了一种名为“深度解剖上下文特征学习”(DACFL)的新框架,用于在训练过程中同时学习局部和解剖上下文特征。我们的框架是使用两个主要组件完成的,局部特征扰动(LFP)和解剖上下文丢失(AC丢失)。其关键思想是,LFP在训练过程中根据先前的解剖分布来扰动脑图图像的局部特征。因此,即使周围特征受到干扰,AC损失也考虑了所有地标之间的几何关系,从而使地标的位置在一定程度上可以预测。为了检测受干扰图像中附近像素信息不可用的地标,该网络需要对大空间范围进行更深入的语义理解。同时,AC损耗通过考虑各个路标之间的几何上下文来帮助网络确定路标的位置。通过执行DACFL的任务,网络可以实现合成丰富的上下文和局部表示的能力。说明DACFL的概念。在临床实践中,解剖类型的分类是主要目标,因此地标只是这一目标的中间表示。尽管其意义重大,但在大多数现有方法中都缺乏改进分类成绩本身的尝试。在本研究中,我们通过提出损失函数来仔细考虑这一问题。在实验结果中,我们表明所提出的DACFL在一个有效的计算时间在ISBI基准上具有最先进的性能。DACFL的主要贡献如下:
- 我们提出了一个新的框架DACFL,强制FCN理解更深层次的脑图语义表示,从而提高性能。我们在ISBI 2015测试数据集[5]上报告了关于里程碑式本地化的最新结果。
- 由于其模块化设计,所提出的模型可以很容易地适用于任何类型的FCN。
- 我们的DACFL模型不仅有助于减少泛化误差,而且对于局部模式变得微妙的低分辨率头颅图处理也具有鲁棒性。
- 我们考虑了所提出的损失函数中地标之间的几何关系,在ISBI2015测试数据集的解剖类型分类方面取得了更好的准确性。
2、相关工作
2.1 颅脑标记检测
2.2 丰富表征学习