11.65 双重代价敏感的属性分类模型
现有属性学习方法中,所有的目标类通常共享一组公共属性,即这些公共属性构成目标对象的表达特征空间。特别是当对象来自很多目标类时,这种表达方式有利于实现不同类之间的知识共享。然而,利用共享属性表示方法会导致类别不平衡问题。即对于某个特定属性,并非所有的目标类在该属性上都有响应,因此相应属性分类任务很可能面临严重的类别不平衡问题。例如,在 Animals WithAttributes 数据集上进行“Blue”属性分类时,负例样本有 23 353 个,而正例样本只有 942 个。然而,现有的属性学习方法无法应对上述类别不平衡问题。为此,本文提出一种双重代价敏感属性分类模型,即在特征选择和属性分类两个阶段分别引入代价敏感信息。具体地,在第一阶段设计了一类基于代价敏感信息的特征选择算法,旨在选择能使误分类代价最小的特征子集;在第二阶段,利用代价敏感分类器进行属性分类,旨在使分类器不会被大量的负例样本所主导。实验表明,所提方法能有效应对属性学习中普遍存在的类别不平衡问题。