[论文阅读] Annotation-Efficient Cell Counting

论文地址:https://doi.org/10.1007/978-3-030-87237-3_39
代码:https://github.com/cvbmi-research/AnnotationEfficient-CellCounting
发表于:MICCAI 21

Abstract

最近深度学习的进展在显微镜细胞计数任务上取得了令人印象深刻的结果。深度学习模型的成功通常需要足够的训练数据与人工注释,这可能是耗时且昂贵的。在本文中,我们提出了一种标注高效的细胞计数方法,将细胞计数网络注入到主动学习框架中。通过在细胞计数网络模型中设计一个多任务学习,我们利用未标记的数据进行特征表征学习,并使用深度聚类对未标记的数据进行分组。深度主动学习不是对每张训练图像中的每一个细胞进行标记,而是只建议对最不确定、最多样化、最具代表性和最罕见的图像区域进行标记。在四个广泛使用的细胞计数数据集上进行了评估,我们的细胞计数器由深度主动学习建议的一小部分训练数据训练而成,与采用全面训练或其他暗示性注释的先进技术相比,取得了卓越的性能。


I. Introduction

属于一篇主动学习领域的论文。虽然标题不带Active Learning这个词,但是对于一些所谓Suggest Annotation、Label Effecient、Annotation Effecient的工作其实也做的都是主动学习。


II. Architecture

[论文阅读] Annotation-Efficient Cell Counting
注意这个网络是一个"Dual Decoder"的网络。其中一个decoder是task decoder,也就是图中的"feature decoder",用来生成一个denstiy map,实现细胞计数功能;另外一个decoder叫classifcation module,可以生成一个(聚)类标签( 1   c 1~c 1 c),这个东西的作用我们后面讨论。另外需要注意的是,classifcation module的输入其实就是bottleneck中的enhanced feature,上图画的并不严谨。


III. Uncertainty

本文的uncertainty用的就是bootstraping,这个很多文章都用过了,这里不再阐述。


IV. Diversity

本文的diversity比较有意思。对于许多工作的话,uncertainty和diversity是串行的,比如先用uncertainty选出不确定的样本,然后用diversity去重;或者先用diversity做聚类,然后在各簇的基础上去搞uncertainty。

本文的话算是故意绕了个小弯,对于输入图像,可以先通过bootstraping算其uncertainty;与此同时,通过classifcation module的聚类功能,为图像分配一个类标签;最终选取的时候只要选取每个类中前几个uncertainty值最高的图进行标注即可。

这里的绕弯体现在分配类标签本来是可以一上来直接k-means一劳永逸的事,原文似乎也没有去阐述这么做的原因。


V. Representativeness & Rarity

这一步的思想在于加入候选标签应该尽可能拉近已标注集与未标注集的特征分布,不过该思路与[1]疑似高度重合相似。


VI. Semi-Supervised Learning

本文还额外用了一个consistency learning来做半监督。即,对于原始图像与经过数据增强的图像,其计数输出结果应一致。通过这种方式能在不依赖额外标签的情况下让encoder看到更多整个数据集的特征而非仅已标注集的图像特征。


Ref

[1] Li, Haohan, and Zhaozheng Yin. “Attention, suggestion and annotation: A deep active learning framework for biomedical image segmentation.” International Conference on Medical Image Computing and Computer-Assisted Intervention. Springer, Cham, 2020.

上一篇:poj2386:Lake Counting


下一篇:Codeforces 1608F. MEX Counting (3200)