在生命的道路上,你可曾感到与时间赛跑的惊心动魄?
其实,很多疾病若能“早检查早发现”,大可将其扼杀在萌芽时期。
阿里巴巴的医疗AI学会了心血管识别技术。它能从CTA影像中精准提取冠脉血管,效率比传统方法高出近百倍,仅需 0.5 秒即可完成检测。
医学影像诊断是医疗AI的热门应用方向,影像诊断的疾病谱系异常宽阔,遍及肝、肺、骨、乳腺、甲状腺、心脏等器官,心血管是其中公认的高难度领域,少有玩家能够触及。
抵达心脏之前,阿里先后创下肺结节检测、肝结节诊断技术的世界级突破。两年时间从肺、肝到心血管的“三级跳”,使得阿里AI进阶为医学影像AI领域的“全垒打选手”。
阿里AI正以肉眼可见的速度朝着“全器官”识别的终点线进化,阿里的肺结节检测、骨科辅助诊疗等新技术都已落地商用。
一旦在横向的疾病谱系和纵向的技术落地上都形成突破,医疗AI就将驱动影像科的技术变革。
没有影像学就没有现代医学
没有影像学就没有现代医学,伦琴发现X射线之前,我们无法透过皮肉看清自己的骨骼和器官——如果不考虑人体解剖的话。
现在,典型的影像科工作图景出现在全世界的医院,一群医生盯着一堆电脑,每天数以千计的图像从医生眼底划过。在中国的大医院,影像科医生每个工作日与电脑对视的时间常常超过10小时。这群人就是医院的视力洼地。
人是肉做的,大量机械重复动作消耗了精力和智力,也成为误诊和漏诊的原因之一。
新的技术变革正在发生,人工智能敲响现代医学的大门。全球每年产生万亿 GB 数量级的医学影像,如果能让机器辅助医生处理片子,多少智力资源将被解放,医生能做更多重要的事,比如多分一点时间给病人。
这是个“望山跑死马”的愿景,看着不远,出发了才知道有多难。
针对个别器官、个别病种,AI 尚且可作单点突围,但如要对各类器官全线取胜,对数据、算法、算力的要求就要提升几个量级。
同时,医学诊断是一套体系自洽、程序复杂并且不无骄傲的链路,新技术要嵌入其间,面临比其他场景难得多的落地关卡。
医疗 AI 为什么扎堆肺结节领域?
肺结节检测是目前人们最熟悉的医学影像 AI 领地。
肿瘤开始的时候可能只是一个结节。但很多肺癌病人在初次就医时,得到的判处就是晚期。
对抗这个头号恶性肿瘤,最好早发现、早诊断、早治疗,可肺结节不容易被察觉,早期结节大多不到10mm,一般不会引发明显不适,很多人因此错过了最佳治疗时期。
比起潜在患者数量,影像科能够消化的病例远不及社会需求。拍摄胸部CT筛查肺结节,每个病例的 CT 影像数量超过 200 张,一个医生每天最多处理几十例影像。高强度的疲劳战下,人工操作的误差不可避免。这是人工智能发挥价值的理想场景。
2017 年 7 月,阿里AI在国际权威的肺结节检测大赛 LUNA16 上打破世界纪录,凭借 89.7% 的平均召回率(在样本数据中成功发现结节占比的比例)夺冠。
LUNA16官网排行
大赛要求参赛队伍在 888 份肺部 CT 样本中寻找肺结节,样本包含 1186 个肺结节,75% 以上都小于10mm。阿里 AI 全程不用人工干预,自动读取病人的 CT 序列,直接输出检测到的肺结节。
2017 年在人工智能业界有“肺结节年”之称——目前已知的大部分AI肺结节检测技术突破都发生在这一年。如今,光是国内公司就有至少几十家宣称实现了肺结节检测算法。
肺结节检测成为医学影像 AI 的入门级领域,算法门槛上的原因有二,首先肺结节影像相对“易读”,影像画面直观、干扰因素少、特征规律可循;其次与肺结节相关的公开数据多,获取便捷,机器训练成本较低。
遗憾的是,对不少医疗 AI 来说,肺结节既是起点,也是终点。
从肝、肺到心血管,阿里AI的“三级跳”
想要打通医学影像疾病谱系,必须祭出硬通货——算法。
2017 年之后,阿里 AI 继续高速奔袭,连续拿下肝结节诊断和心脏冠脉提取的两项世界*赛事冠军,宣示了在算法领域无可匹敌的优势。
2018 年 12 月,阿里AI从近百支队伍中脱颖而出,在全球LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区CT图像分割挑战)获得两项第一。
肝脏是人体管状物分布最密集的器官,内含门静脉、肝静脉、肝动脉、胆管系统等多套管状系统。肝结节形态多样,结节间灰度分布差异大,与周围组织灰度相似甚至没有清晰的边界,对AI的“视力”挑战大于肺结节。
阿里 AI 通过对 CT 图像层间信息和层内信息融合的网络结构分析解决了肝结节类别多样性的问题,用到了基于原子卷积的空间金字塔池化(Atrous Spatial Pyramid Pooling)、亚像素卷积(Sub Pixel Convolution)等技术。目前,阿里团队正进一步研究如何判断肝结节的良恶性。
半年后,在 2019 年的心脏冠脉中心线提取鹿特丹比赛(Rotterdam)上,阿里 AI 获得全自动提取赛事第一名,相关论文被国际*医学影像会议MICCAI 2019 提前接收。
从CTA影像中准确提取心脏冠脉中心线是冠心病影像诊断的必备条件。通常的流程是,医生根据二维图像对血管进行三维重建,形成曲面重建视图,手动提取冠脉血管,寻找并标注血管斑块,判断血管病变性质,从而确定治疗手段。
心脏冠脉平均长度164mm,几何特性复杂、血管特别细小。比起肺结节的静态扫描图像,为不断跳动的心脏作三维图像重建棘手得多。传统的心脏冠脉中心线提取方法大多存在人工交互多、耗时长等缺点。
阿里AI提出了判别式冠脉追踪模型,三维卷积神经网络构成的模型,充分利用三维空间特征,从影像中迭代搜索完整血管,无需人工交互,提取单根冠脉血管平均耗时 0.5 秒,提取完整冠脉树用时不超过 20 秒,相比传统方法效率提升近百倍。
心血管疾病诊断的复杂性,导致AI医学影像识别在该领域应用极少。阿里的技术突破,让AI辅助医生进行心血管疾病诊断的未来变得近在咫尺。
从肺、肝到心血管的“三级跳”,姿态有多轻盈,算法就有多厚重。算法突破没有捷径,拼的就是人才浓度。事实上,阿里达摩院已经悄然聚齐国内最强 AI 研发者阵营——达摩院现有 10位IEEE Fellow、20 多位知名大学教授,一半以上科学家拥有名校博士学历。
夺冠以后,阿里 AI 还做了这两件事
光有算法远不足以推动技术落地。算法模型与现实场景的结合才是难点,具体到医疗 AI ,需要解决的问题很多,比如,如何在真实医疗环境中证明模型的准确率,如何解决真正的临床关切问题,如何确立服务模式和商业模式。
比起 LUNA16 夺冠,阿里在 2017 年做的另外两件事,更能显示其打法思路。
当年 3 月底,阿里云联合英特尔、零氪科技发起第一季“天池医疗 AI 大赛”, 以肺结节智能识别和诊断为课题,开展肺癌早期影像诊断的应用探索。16 家三甲医院的医师组成专家指导团,来自 20 个国家的2887 队伍报名竞技,整个赛程长达半年,部分优秀算法最终转化为了实际解决方案。
三个主办方各司其职,阿里云提供机器学习训练平台,单点支持数百 GB 内存,每次迭代可高速处理 32 张以上 128x128x128 甚至更大规模的 3D 图片;英特尔提供由第二代强融核处理器打造的高性能计算集群,保障高强度算力供应;零氪联合 16 家医院提供全球最大规模的 2000 份“科研级胸部CT数据集”。
这场非商业赛事动员了整个行业的智慧,推动肺结节检测的算法优化和技术沉淀。但它更重要的价值在赛事榜单之外——让专业医师与算法工程师走到一起,探讨影像学与 AI 的协作方式,从算法层面就关注 AI 嵌入医学流程的可行性。
“开放”一直是阿里追求的 AI 产业生态。阿里的 AI 平台能为中小企业提供人工智能基础设施和 AI 算法包,包括标准算法接入、运行环境托管、线上线下资源对接等服务,帮助企业快速低成本的构建专属智能应用。
不论以领路者身份做东办赛,还是在后方提供基础设施,都符合阿里一贯的平台思维和生态打法。也许是得益于这种开放思路,阿里的 AI 工程师总能比别人更早发现产业痛点,更懂得以需求为导向推动产品创新。
比如,AI 肺结节检测准确率逼近理论极值,但为什么医生们并不感冒?甚至有医院同时部署多个公司的多种算法,但并不特别依赖任何一种。
答案也不复杂,单项的肺结节检测技术,即便在真实场景中的表现不输于实验室,也无法提升影像科医生的整体效率。肺部疾病种类多样,肺结节只是其一,医生阅片不可能只排查这一种,机器不能真正减轻医生负担。
基于这样的判断,阿里团队在肺结节*赛事夺冠之后,马上投入了肺部综合诊断方案的研发,实现对六种常见肺部病变的影像诊断:肺密度增高影、肺索条、肺大泡、动脉硬化、淋巴结钙化和肺结节。综合方案涵盖了大部分肺部疾病的早期筛查,不论对于医院影像科还是体检机构,都有非常现实的作用。这项技术现已通过阿里云对外输出,累计服务近千万用户。
医学集成了人类这个物种最大的自负和自卑,我们一方面相信,这门凭借代际智慧和临床经验立身的专业充满不可言说的经验性,没有谁能比人做得更好;另一方面我们深知,我们对自己身体的了解非常有限,机器又如何能懂得更多?
没人怀疑AI医学影像符合未来医学的发展趋势,但研发者们仍要不断证明 AI 的价值,让医疗 AI 的服务模式跟上技术进步的节奏。