摘要
胸部X光检查时临床上最常见和最实惠的放射检查之一。虽然在胸部X线上检测胸部疾病仍然是一项具有挑战性的任务,但由于1)不同胸部疾病患者的X涉嫌上病变区域出现的高度不同,以及2)放射科医生缺乏准确的像素级注释来进行模型训练。现有的机器学习方法无法应对胸部疾病通常发生在局部疾病专用区地 挑战。在这篇文章中,我们提出了一种弱监督深度学习框架,该框架配备了挤压和激励块、多地图传输和最大-最小合并,用于胸腔疾病的分类和可疑病变区域的定位。在chestX-ray14数据集上进行了全面的实验和讨论。数值和可视化结果都证明了所提出的模型的有效性,并与目前最先进的方法进行了对比,证明了该模型的具有较好的性能。
论文试图解决什么问题?
Chest x-ray 多分类
这是否是一个新的问题?
不是,提高精度
这篇文章要验证一个什么科学假设?
在主干网络Densenet121加入SE block 、Multi-map Transfer Layer、Max-min Pooling,提升精度
有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
文献26提出了胸部X线数据集的多视图版本-MIMIC-CXR,并在此基础上自然地提出了一种双重深度卷积网络框架,以利用正侧视图(如果给出)来进行疾病分类。 [26] Jonathan Rubin, Deepan Sanghavi, Claire Zhao, Kathy Lee, Ashequl Qadir, and Minnan Xu-Wilson. 2018. Large Scale Automated Reading of Frontal and Lat- eral Chest X-Rays using Dual Convolutional Neural Networks. arXiv preprint arXiv:1804.07839 (2018).
论文中提到的解决方案之关键是什么?
在主干网络Densenet121加入SE block 、Multi-map Transfer Layer、Max-min Pooling
论文中的实验是如何设计的?
对于SE块,我们按照建议将缩减率设置为16[13]。我们将多地图图层中的M设置为12,实验证明这是性能和复杂度之间的有效折衷。对于最大-最小合并,我们使用k+=k−=1和α=0.7,如[7]所示。端到端模型由ADAM优化器[17]用标准参数(β1=0.9和β2=0.99)训练。我们使用预先训练的DenseNet模型中的权值对模型进行初始化,并且仅从头开始训练多映射传输层和新插入的压缩激励层。继先前在胸片X射线14[25]上的工作后,我们设置了批次大小16和初始学习率0.0001。当验证损失平台期超过5次时,学习速率会下降10倍,验证损失最小的模型将是所选择的分类器。 原始图像大小为1024×1024,对于很深的卷积神经网络是不可行的。在本文中,由于预训练模型DenseNet只接受3通道图像作为输入,因此我们将图像调整为512×512的大小,并将单通道X射线图像转换为3通道RGB图像。作为ImageNet,对每个通道中的像素值进行归一化。在训练过程中,我们从输入的512×512图像中随机裁剪出448×448个子图像来扩充原始训练子集。裁剪的子图被随机水平 翻转,以增量地增加村联样本的变化性和多样性。在评价过程中,我们为每个评价样本输入10个随即裁剪的448×448个子图像(四个角作物和1个*作物加上水平翻转的版本),并以平均概率作为最终预测。
用于定量评估的数据集是什么?代码有没有开源?
Chest X-ray14,无开源代码,但对应的SE blocks有开源代码https://github.com/xmu-xiaoma666/External-Attention-pytorch
论文中的实验及结果有没有很好地支持需要验证的科学假设?
利用消融研究的方式分别对SE block 、Multi-map Transfer Layer、Max-min Pooling三个模块进行了实验,AUC分别从0.8302降低到0.8279、0.8290、0.8220,证明了三个模块的有效性。
这篇论文到底有什么贡献?
1、在DenseNet块的卷积层后嵌入一个“挤压激发”块进行特征重校准。
2、将堆叠的多图传输层连接到DenseNet替换全连接层的以缓解多标签问题,这在标签有噪音时变得至关重要。
3、我们结合了max-min池化操作,将来自多个地图的空间激活聚合到最终预测中。
下一步呢?有什么工作可以继续深入?
在未来的工作中,我们将利用有限的边界框重新研究病变区域的精确定位。