微软拟用DNA存储数据:一段就能顶一个数据中心

5月24日消息,据Technologyreview报道,微软公司旗下研究院的研究人员表示,在早期利用NDA存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置。

微软研究院的计算机架构师表示,该公司已经正式制定了一个目标,即在2020年之前,在数据中心内建立一个以DNA为基础的操作存储系统。微软研究院架构师道格·卡米(Doug Carmean)说:“我们希望3年内实现这样的愿景,即在原始商业系统中的DNA上存储相当于1个数据中心的数据量。”卡米还描述了最终设备的大小,它与20世纪70年代的施乐复印机差不多。在内部,微软怀有更宏伟的目标,即利用生物学取代磁带驱动器,这是一种用于归档信息的通用格式。卡米说:“我们希望把它命名为‘DNA存储'。”

这些计划表明,许多科技公司正严肃地对待这个看似奇怪的想法,希望将视频、照片或有价值的文档保存在基因构成的分子中。Semiconductor Research Corporation首席科学家维克多·日尔诺夫(Victor Zhirnov)表示,努力增加计算机内存依然存在物理极限,而DNA却拥有令人难以置信的密度,可用其存储数据。

在DNA中,每部电影都被压缩到比方糖更小的体积。日尔诺夫说:“DNA是宇宙中已知最密度最高的存储介质,这就是为什么人们会看重这种研究潜力的原因,我们正在解决存储信息呈现指数增长的问题。”去年七月份,微软公开宣称它在DNA链中储存了200兆字节的数据,其中包括一段音乐视频,创下了新的记录。卡米与微软研究院专家卡琳·斯特劳斯(Karin Strauss)、华盛顿大学计算机实验室科学家路易斯·塞泽(Luis Ceze)在预印服务器BioRxiv上发表论文,介绍了他们取得的进展。

利用DNA存储数据的主要障碍仍然存在,将数字位转换成DNA编码(由A、G、C和T组成的核苷酸链)仍然费力而昂贵,因为制造DNA链需要漫长的化学过程。在其示范项目中,微软使用了13448372个独特的DNA片段。专家表示,在公开市场上购买这些材料要花80万美元。哥伦比亚大学研究DNA存储方法的教授雅尼弗·埃里奇(Yaniv Erlich)说:“用DNA存储数据的主要问题是成本高昂,因此微软方案最重要的地方是其是否能解决这个问题”。在阅读卡米等人的论文后,埃里奇说:“我没有看到帮助实现这个目标的任何进展,但也许他们还有更多新东西。”

微软表示,DNA存储成本需要下降10000倍后才可能被广泛采用。虽然许多专家认为这是不可能的,但微软坚信这种进步可能会发生,前提是计算机行业需要它。将数字数据写入DNA的过程自动化也是至关重要的。根据数周的实验显示,卡米估计向DNA中转存数据的速率是每秒400字节。微软表示,这个速度需要增加到每秒100兆字节。

读取数据变得越来越容易,通过使用高速测序机就可实现,包括召回文件的特定部分,类似于计算机上的随机存取存储器。微软认为,如果DNA阅读获得两倍改进,就能促使该系统的效率满足商业用途。由于写入和检索数据到DNA中非常缓慢,任何早期使用的技术将仅限于特殊情况。这可能是因为需要存档的数据存在法律或监管原因,如警察机构的CAM视频或医疗记录。

微软目前正与位于旧金山的DNA制造商Twist Bioscience合作,后者是新成立的公司,致力于提高DNA产量。除Twist Bioscience之外,其他类似公司还包括DNAScript、Nuclera Nucleics、Evonetix、Molecular Assemblies、Catalog DNA、Helixworks以及从Oxford Nanopore剥离出来的Genome Foundry。

有些初创公司正追求令人兴奋的愿景,即用一种使用酶的DNA代替40年的化学反应过程,就像我们自己的身体那样。Technicolor Research的科学主管让·伯洛特(Jean Bolot)说:“我相信今年会看到结果。”他的公司始终在与电影公司讨论如何用DNA存储。他说,1951年之前的半数电影因为存储在电影胶片上而丢失。现在有了新的格式,如高清视频和虚拟现实,正在扩大工作室保存这些作品的能力。

日尔诺夫表示,计算机芯片制造商非常看重DNA存储技术,因为传统媒介(如磁带或硬盘)存储数据总是存在物理限制。日尔诺夫所在的机构由微软、英特尔以及其他机构资助,他们正进行应用研究,并从2013开始开始瞄准DNA。他说,认为DNA太“软”的半导体专家们惊讶地发现,它比硅器件长100到1000倍。这种分子非常稳定,经常可以从猛犸象骨头和远古人类遗骸中提取到。

但其最重要的特征是高密度性。DNA可以在1立方毫米的片段上容纳100亿亿字节信息。日尔诺夫说“密度才是最重要的”。微软研究院发言人表示,该公司目前无法确认“产品计划的具体细节”。在公司内部,DNA存储的想法显然得到许多人支持,但尚未被普遍接受。卡米说:“我们内部的人相信我们,但支持磁带存储的人还存在怀疑。”

除了质密耐用外,DNA存储还有其他不被经常提到优势,即与人类物种的极端相关性。想想那些你已经无法读取的旧软盘或难以辨认出象形文字的粘土片。与这些媒介不同的是,DNA永远不会过时。卡米表示:“只要我们依然是人类,我们永远都能读取DNA。”

本文转自d1net(转载)

上一篇:计算机视觉转型大数据开发,分享一下我的学习历程和大厂面经


下一篇:在CentOS 7上配置MySQL的主从复制模式 (Master-Slave Replication)