3.2 生命科学

图 1:       基因测序是千亿大市场(华大基因)


3.2 生命科学


资料来源:互联网

互联网、云计算、大数据的新科技普及,大幅推动生命科学商业化进程。2016年生命科学将在医疗领域取得诸多技术突破,美国*宣布投入2亿1500万美元用于”精准医疗计划“(Precision Medicine Initiative),Facebook、Google等科技公司也积极开展此领域投资;中国版精准医疗计划即将启动并投入巨资,包括精准诊断、精准治疗两个方面,前者的重要技术是基因测序,不同患者对疾病易感程度的差异和对药物敏感性不同的主要原因,是人的基因多态性造成的个体生理特征差异,因此开展精准医疗必须以分子诊断技术为依托。

研究表明,基因测序市场将保持快速增长从2007年的794.1万美元增长到2018年的117亿美元。2001年,6个国家科研团队耗时11年,花费30亿美元,共同发表了首个人类基因组工作草图;2007年,科学家只需100万美元就能完成一个人体基因组的测序工作;2013,这一价格已大幅降至2500美元。而2015年此成本继续缩减至不到1000美元,测序时间只需要几天。随着下一代基因测序、生物质谱和医学成像等医学技术的迅猛发展,大数据浪潮为生物医学带来了前所未有的机遇,将根本性的改变生物医学基础研究和医疗实践。一个人的基因组检测大约需要产生 90Gb 的数据,生命科学领域数据爆炸式增长,也对海量数据的计算、存储和分析提出新的挑战。云计算将大量计算资源、存储资源和软件资源虚拟化,形成规模庞大的共享资源池,可以有效解决生物医学对IT资源的弹性需求。阿里云在生命科学领域正在发挥越来越重要的创新赋能作用。

1)     基因版“本草纲目“:中国是世界出生缺陷率最高发的地区之一。每年1600万至2000万的出生人口中,有80万至120万出生缺陷儿。1996年到2010年,中国新生儿出生缺陷发生率增幅达70.9%,每一万名新生儿中就有149.9人患有先天性缺陷。为改变中国下一代的身体健康,国际领先的基因测序临床转化服务商贝瑞和康生物技术有限公司采用阿里云技术,打造以海量的中国人群基因组数据为核心的“神舟基因组数据云“,目前已包含超过四十万份基因组数据,首先在阿里云平台上调动海量计算资源,对这些个人基因组大数据进行批量计算[1]、分析、存储,通过对该数据资源的深入挖掘,进一步揭示中国人群遗传突变分布,这将极大助益于提升中国人遗传疾病诊断的效率和精准程度。相当于建立起一个中国人基因版的云端《本草纲目》,记载中国人群最核心的基因信息、生命信息,为中国人群重大疾病的预测、预防、诊断和治疗奠定基础,其意义不亚于《本草纲目》这部东方医药巨典。

2)     精准医疗云:为加速精准医疗在中国实际落地,实现2020年精准医疗愿景,华大基因、阿里云、英特尔战略合作,共建亚太地区首个“精准医疗开放云平台“,创新性应用基因组数据分析、公有云数据处理、高性能计算,使得基因分析、精准诊断和制订个性化治疗方案在一天内完成,为中国百姓提供更公平、更高品质的医疗服务。用户将能够通过互联网远程操作进行测序数据的处理,随时随地获取生物信息分析资源。由于DNA测序技术成本的下降幅度远远高于测序数据存储成本,云计算已成为基因组学研究领域中的一个日趋重要的工具或服务。目前众多研究实验室均缺乏存储、计算资源和处理当前庞大基因组数据的技术,华大基因提供的基因测序云服务将为此难题提供“一站式”解决方案。

3)     云之稻:为非洲和亚洲资源贫瘠地区培育绿色超级稻,中国农业科学院、阿里云计算有限公司、华智水稻生物技术有限公司、北京聚道科技有限公司共同推动“云之稻项目”,共建最全面的“水稻功能基因组和育种信息数据库”与高效水稻基因型分析技术平台,并将3000份水稻基因组测序数据和种质资源在云上无偿向外界共享,是迄今为止全世界最大的植物基因组测序项目。3000份水稻基因组测序项目分析得到的数据量达到几百T,生物学研究进入了大数据时代,需要全世界所有科学家和有兴趣的人士参与进来分析挖掘,在阿里云平台上通过对象存储服务(OSS)提供的免费存储和下载服务,Rice 3K项目的水稻基因组数据可以随时为全球科学家所用。

 



[1]阿里云批量计算服务是一种适用于大规模并行批处理作业的分布式云服务,适用于生物基因分析、渲染、多媒体转码、科学计算、金融保险分析等多个行业领域。




作者:阿里云研究中心副主任 田丰

上一篇:[C#1] 5-属性


下一篇:3.5 智能物联