改进预训练编码器U-Net模型的PET肿瘤自动分割简评

  • 研究方法

在本文中提出一种浅层U-Net网络结构,使用ImageNet上预训练的VGG19编码器替换其原编码器,网络结构如图 1所示,该模型包括两个路径,左侧收缩路径和右侧扩展路径,通过收缩路径中的卷积和池化来聚合上下文信息,通过扩展路径中的卷积和上采样来恢复完整图像分辨率。其中网络共14层,可训练参数1 605 961个,步幅固定为2。使用前两个VGG19卷积块作为收缩路径,并每个卷积层的激活函数使用修正线性单元(ReLU)。相对于对称的扩展路径而言,在每个卷积层之后安排ReLU和批归一化(BN)。由于每次卷积后边界像素的丢失,因此裁剪是必要的。通过连续的卷积和池化,卷积层可以整合的上下文信息从区域到全局尺度,因此降低了输出层的分辨率,在扩展路径中将池化替换为上采样这样做为了解决多尺度信息融合和全分辨率像素分类之间的冲突。来自收缩路径的高分辨率特征与上采样输出相结合。在最后一层,使用1×1卷积来映射每个64分量的特征向量,并且每个元素表示对应的输入像素属于肿瘤的概率,下面详细介绍网络结构中所做的改进。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

图1.网络结构

在本文中,VGG19编码器中只使用VGG19的block1和block2,每个block包含两个卷积层。

本文引入了一种新的基于Jaccard距离的损失函数。基于Jaccard距离样本之间的不相似性,与Jaccard指数互补。定义G表示手动分割肿瘤区域,M代表计算机生成的掩模,Jaccard距离定义为

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

dJ(G,M)本身不可微分,因此难以应用于反向传播。本文设计以下损失函数

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

该损失函数不需要权重图重新平衡来自肿瘤区域和背景的像素。同时,提出的损失函数是可微的,即式可以在训练网络时,有效集成到反向传播中。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

  • 实验结果

数据集:使用美国芝加哥大学医学中心提供的数据库。本数据库包含25名患者的真实临床图像,每位患者被视为一个病例,每个病例有两组数据,分别是放疗前和放疗后的图像。本文将数据库拆分为放疗前(BR)子数据库和放疗后(AR)子数据库。BR子数据库包含769幅图像(24个病例用于训练,1个病例用于测试),AR子数据库包含540幅图像。所有图像都具有特定的金标准,由放射科医师手动描绘。数字化后产生8位PET图像,分辨率为128×128像素,像素尺寸为4.5 mm×4.5 mm。模型在BR子数据库上进行训练、验证和初步评估,并用AR子数据库进行进一步评估。

实验分析:分析了VGG19预训练编码器、损失函数和正则化方法对提出的分割模型的影响。

第1个实验比较是否应用VGG19预编码器对实验结果的影响;

第2个实验比较基于Jaccard距离的损失函数与基于交叉熵的损失函数对实验结果的影响;

第3个实验评估DropBlock和dropout正则化方法对实验结果的影响。

VGG19预训练编码器

由图2可以看出使用预训练编码器的模型收敛更快且实现更低的损耗值。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

图 2 使用/不使用预训练编码器对模型的训练损失比较

基于Jaccard距离的损失函数

本文中所构建的网络模型将使用两种不同的损失函数进行训练。使用交叉熵作为损失函数时的PPV为0.922,而使用Jaccard距离时为0.899,原因:交叉熵模型从前景像素和背景像素两者考虑,而Jaccard距离聚焦于前景像素,与图像分割的任务更相关。表 1所示,基于Jaccard距离的损失函数获得较高的SE和Dice。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

基于DropBlock的正则化方法

本文将损失函数固定为Jaccard距离,将DropBlock(DB)与dropout(DP)进行了比较。bsbs设置为3,5,7和9,并将kpkp设置为0.5和0.8。表 2所示,当bsbs= 5和kpkp= 0.5时,所有指标都高于其他指标。在以下实验中,使用DropBlock,且bsbs = 5,kpkp = 0.5。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

与传统U-Net模型对比

进行验证模型的关键组成之后,将训练好的网络应用于BR子数据库的测试数据集,使用13层U-Net作为基准。图 3是几个典型的自动分割例子,我们从图片中可以看出,本文提出的模型比传统的U-Net模型在分割肿瘤时,具有分割结果更完整、保留更多边界细节的优势,模型准确描绘了肿瘤,并且在各种图像采集条件下都很稳定。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

图 3 3个例子的分割结果

AR子数据库进一步评估

本文使用AR子数据库进行了两个实验进一步评估模型的性能。实验1直接用BR子数据库中性能最佳的模型来执行AR子数据库图像分割任务。实验2通过AR子数据库进一步训练网络,调整在实验1中选择的模型的权重,其中398幅图像用于训练,100幅图像用于验证,剩下的42幅图像用于测试。在训练100个epoch后,在验证图像上选择表现最佳的模型。

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

表 3可以看出,本文模型获得了比较好的分割结果,经过对模型的进一步训练,获得最佳分割性能。

3D体积计算

使用本文模型将病例6的肿瘤自动分割结果3维可视化(图 5所示),与医生给出的金标准3维可视比较(图 6所示),可以发现自动分割肿瘤的体积与专家提供的真实肿瘤的体积相当,本文模型的分割体积可达到金标准的88.5%,高于Chen等人(2016)提出的MTANN模型

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

图 5 BR子数据库案例6的3维可视化

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

改进预训练编码器U-Net模型的PET肿瘤自动分割简评

图 6 BR子数据库案例6的肿瘤体积结果

  • 研究结论

在本文中提出一种带有VGG19预训练编码器的14层改进后的U-Net肿瘤分割模型,实施了3步有效策略,训练样本少导致过拟合的问题一定程度上得到解决。该模型能够全自动并且较为精准地分割PET图像中的肿瘤。在本文中通过预训练VGG19的部分参数初始化U-Net模型参数;为了提高分割性能使用基于Jaccard距离的损失函数;为有效地规范卷积网络使用了一种新颖的基于DropBlock正则化方法,与dropout相比,训练后的模型鲁棒性和泛化能力更强。通过以上几种对模型的改进方法的结合,实验表明本文提出的改进模型可以较为稳定、精准地分割PET图像中的肿瘤。

上一篇:虚方法(virsual method)


下一篇:多态