A laminar augmented cascading flexible neural forest model for classification of cancer subtypes based on gene expression data
注:该文章的图片均来自该论文
该分类算法来自上面这篇文章。这是一篇关于生物信息工程领域的一篇文章。大致背景就是癌症是和基因有紧密关系的。所以通过基因数据进行癌症的种类确认是非常具有研究价值的。但是就目前的数据来说,相关的基因数据样本数量少,维度高,导致现有许多的分类算法面临过拟合或者低分类准确率的这么一个情况。然后这篇文章就是来解决这个问题的。它提出了一种新的分层拓宽思想,其实就是提供一种新的集成学习的结构设计思想。
既然是集成学习,那必然有基本的学习器:Flexible neural tree (FNT):
这是一个自下而上,从叶子结点到根结点的计算过程。图中的+number是可以进行修改的(就是这个结点输入的数量)。从图和这个树的名字可以看出来,这种算法它非常灵活,支持输入向量和结点的跨层连接(图中的x就是数据向量),这就导致的结构的多样性。还有一个最大的好处就是,这个算法不用设置超参,结构也能自动确定。它的流程如下:
至于如何自动确定,该文章也没有细讲(没有说明),反正就是能够自动确定。