1.5 人工智能在各医学亚专科应用的局限性
首先,就是数据量的问题。应用Deep Learning的方法训练学习,首先需要足够的数据量。在“Nature”撰文的斯坦福大学研究的算法能够取得90%以上的准确率,其原因,一方面是科学地选用了CNN的算法,另一方面则是有海量的数据作为支撑(超过以往公布数据集数据量的100倍)[8]。因此,数据量的缺乏是Deep Learning发展的主要阻力之一。在我国,医疗数据分散化,难以集中。第二,数据的维度仍然是一大问题。目前,Deep Learning主要用于2D图像,三维图形、四维图形难以应用。第三,数据的质量问题。Machine Learning算法在数据量不足的情况下会存在过度拟合(over-fitting)的可能,造成运算结果不稳定,故必须利用完全独立的数据集来测试模型的稳定性。第四,深度学习是一个“黑箱”,这个“黑箱”存在欺骗的问题,即如果输入的数据存在变异,则可能误导Deep Learning(不稳定性)。第五,医学需要的是因果关系(causal inference),但机器学习找到的大多是相关性,如何从成千上万的因素中找到因果关系是很困难的。