11.66 结构属性表示及其在脑影像分析中的应用
传统属性表示方法主要集中在视觉属性、部件属性和相似属性。由于现实问题的复杂性和多样性,现有的属性表示方法无法对具有明显结构信息的图像进行有效表达。例如,在脑影像分析领域,人们经常利用磁共振成像(MRI ,Magnetic ResonanceImaging)技术显示不同结构的解剖和病理断面图像,从而直观地研究脑结构及其变化。由于这些MR 图像具有明显的结构特性,能在一定程度上反映被试者大脑的病理变化,因此对于脑疾病诊断具有重要意义。然而,现有的属性表示方法无法对这些具有明显结构信息的图像进行有效描述。同时,在脑影像分析领域,目前仅有少量基于属性学习的研究工作,而这些工作一般利用人工定义的语义属性来描述图像,没有充分利用脑影像中存在的丰富的结构信息。受自然图像中属性定义方法的启发,本文首先提出了针对脑影像的结构属性概念,并设计了一种利用聚类算法从数据中自动确定结构属性的方法;同时,搭建了一个通用的基于结构属性的脑影像分类框架。具体地,首先利用本文提出的多结构属性表示方法实现对脑影像的特征表达,并提出一种关系诱导的稀疏特征选择算法,最后采用基于多结构属性的集成分类方法进行脑影像分类。进一步地,将所提方法应用于阿尔茨海默病的自动分类和早期诊断,并通过在标准数据集上的分类实验验证了所提方法的有效性。
本文围绕属性学习中的若干重要问题进行了探索,发展出了一系列新的属性学习研究方法,并通过在标准数据集上的实验验证了所提方法的有效性。然而,由于实际问题的复杂性,本文所提出的方法仍面临许多挑战。下面,简单列举属性学习中有待进一步研究的问题,并提出相应的解决思路。
(1)属性表示可以看作低层特征和高层类别标号之间的中间层特征,因此定义属性的过程可以理解为一种特征表示学习。与深度学习相似,这种特征表示学习通过抽取或凝练出不同的中间层特征来表征对象复杂的外观变化。尽管通过深度学习方法获得的特征通常不具备传统属性所具备的语义解释性,然而我们仍可以借鉴深度学习的方法来定义判别性属性,以解决人工定义属性所带来的成本昂贵的问题。
(2)传统的属性学习模型中,属性之间共享所有的低层特征。然而,由于属性之间存在某种内在关系,这种关系在一定程度上会影响不同属性对低层特征的依赖。例如,“会飞”和“翅膀”两个属性之间存在正相关关系,因此它们可能共享某些低层特征;而“金属的”和“塑料的”两种属性存在负相关关系,因此它们可能会排他性地利用某些低层特征。利用这种先验知识,可以设计一类兼顾共享性和排他性的属性特征选择模型。
(3)为了应对属性学习中的类别不平衡问题,除了采用本文提出的代价敏感学习方法外,还可以考虑从数据层面提出不同的解决方案。例如,可以通过一定的预处理过程把分布不均匀的训练数据调整为正负例样本均匀分布的数据,从而减小类别分布不平衡对学习过程带来的负面影响。
(4)不同属性一般具有不同的判别性能,如果不加选择地简单使用所有属性,会降低学习模型的学习性能,同时增加不必要的计算负担。但是,现有的研究中缺乏对属性本身判别性能的考虑。设计有效的属性选择方法有望解决该问题。
(5)类似于人脸识别中采用的属性(如“年龄”和“性别”),脑影像分析中被试者的年龄、性别和受教育年限等信息可以作为属性表示。此外,脑疾病诊断过程中经常产生一些度量脑认知状态的临床变量值,例如诊断阿尔兹海默病诊断过程中产生的简短精神状态量表(mini-mental stateexamination, MMSE)得分等。这些临床变量值定量反映了被试者的脑认知状态,而脑认知状态是由被试者内在的病理结构(即脑结构和功能变化)所决定的。从这个意义上说,这些临床变量值和脑影像从不同层面反映出被试者的病理结构,因此与脑疾病相关的临床变量值可以作为脑影像的属性表示,有望进一步提高脑影像分析方法的性能。