相信不少人已经早就看过了吴恩达(Andrew Y. Ng)大佬发表在Nature Medicine上的ECG诊断算法方案。深度学习网络一举打败了经验丰富的心血管疾病专家,在常见的12种ECG正常或异常判定中的F1达到了0.837,而参与实验的6位医生的平均F1却仅有0.780。对这样的结果,当然可以有所质疑,毕竟这几位医生可能并不能代表人类的诊断水平,不过这确实再一次反映了深度学习的强大。没看过的童鞋建议去看看:https://www.nature.com/articles/s41591-018-0268-3 ,说不定就有所启发呢。
剥去吴大佬以及Nature子刊的光环,我们来看看这篇文章到底好在哪里。说实话,如果你真的认真看了一下原文以及对这个领域有所了解的话,你可能就会觉得这篇文章的核心并不在于他用了多新颖的网络结构(ResNet-34的小改版),而是在于那个包含91232条记录,并附带详细专家标注的数据库;另外,算法真的跟实际硬件产品挂钩了,就是iRhythm的Zio便携监护仪,并通过了FDA认证。以上两点再加上出众的效果,并且有人类专家的参与实验和背书,多方的合作造就了这么一个完整,扎实,有意义的研究。
比较尴尬的是,虽然吴恩达课题组开源了代码,但可能是基于一些其他方面的考虑,对使用的大数据库并未开源。这就使得复现算法变得很困难。我们能做的,也就仅有利用手头的一些数据库去进行研究了。本人之前曾写过在MIT-BIH数据库上进行入门的系列博客,出于对小白友好的考虑,因此整体方案为intra-patient,而且样本整理地非常均衡。不过有很多童鞋想看一看inter-patient的实践,又恰好最近的科研中也涉及到了MIT-BIH数据库,因此就结合吴恩达的网络,对MIT-BIH数据库的inter-patient诊断做了一个小的尝试。目前代码已经开源:。主要内容如下:
- 缩减了网络。由于MIT-BIH数据库总样本量不大,因此对原有网络进行了缩减,由吴恩达改装版ResNet-34变为改装版ResNet-18。
- 调整了参数。网络结构和任务都发生了很大变化,因此对一些细节参数进行了调整。
- 根据AAMI标准划分5类,N,V,S,F,Q。训练集和测试集采用了最常用的DS1(22条记录)-DS2(22条记录)inter-patient划分。
- 不进行QRS波检测,对一个任意5s切片进行诊断,个人认为这样可以让网络脱离对QRS波检测算法精度的依赖,更贴近实际一些。
- 进行了与其他目前已发表工作的性能分析和对比。
当然也有几点声明。首先这不是一篇论文,只是一篇仅用于学习交流的博客,所以并不会有什么特别的创新或是深邃的思想;其次有些地方包括最终的效果还存在很多改进空间,因此大家也不要期望过高。如果有大佬可以提出具体的,有建设性的改进方案,非常欢迎。
下篇正式开始。
Github:https://github.com/Aiwiscal/MIT_Scheme
喜欢请点赞和github给star哦~~~~