微软DNA存储突破 未来或取代硬盘磁带
微软本周宣布,利用DNA存储技术完成了约200MB数据的保存,其中包括《战争与和平》,以及99部经典文学作品。
此前已有研究人员证明,数据可以被保存在DNA之中。不过微软表示,此前并没有任何研究者能一次性向DNA写入如此多数据。
微软该项目首席研究员卡林•施特劳斯(Karin Strauss)表示,DNA是一种优良的存储介质。相对于传统存储技术,DNA存储能带来更高的存储密度。华盛顿大学也参与了这一研究项目。目前,这项技术成本昂贵,操作复杂。
不过,微软希望借力生物科技行业的研究成果。由于生物技术的进步,近期DNA读写工具的成本正在下降。DNA被认为是磁带的替代选择,后者是目前用于长期存储的标准介质。
施特劳斯表示:“微软希望看看,我们能否开发出基于DNA的端到端系统去保存信息。这样的系统将是自动化的,并且可用于企业。”她表示,微软开展这一项目的动机在于,当前的电子存储设备发展速度赶不上数据量的增长。“如果你关注当前的项目,那么可以看到,我们无法在期望的成本内保存所有信息。”
IDC预计,到明年,全球范围内保存的数字化数据将达到16万亿GB,其中大部分位于大型数据中心。施特劳斯估计,一个鞋盒那么多的DNA就足以保存100个大型数据中心的数据。
DNA也有着很好的耐久性,尤其是在干燥寒冷的情况下。今年3月,有研究人员宣布,已部分重建了古人类基因。这些古人类的骨骼保存在西班牙一处洞穴里已有超过40万年历史。作为对比,磁带保存数据只有几十年时间,随后就会老化。
将数据保存在DNA之中需要将0和1数据转换为4种核苷酸,即碱基组成的序列。2012年,哈佛大学分子生物学家乔治•切奇(George Church)向DNA中写入了一本5万个单词、数据量不到1MB的书,随后将其印刷在比花粉粒还小的玻璃芯片上。今年,切奇又报告称,已实现了22MB数据的DNA编码。
微软此次则宣布,已成功向数百万DNA写入了10倍于此前的数据量。每个DNA包括150个碱基。
加州大学伯克利分校博士后研究员雷因哈德•赫科尔(Reinhard Heckel)也在研究利用DNA去存储数据。他表示,微软的成功令人关注。不过,阻碍DNA存储技术大规模使用的障碍主要是成本,因为制作订制的DNA分子成本高昂。“如果希望人们接受这一技术,那么你需要这项技术的成本低于磁带,这很难。”
微软并未披露此次DNA数据存储项目耗费的成本,这其中用到了约15亿个碱基。负责合成这些DNA的Twist Bioscience通常每碱基价格为10美分。商用合成技术的成本最低可以达到每碱基0.04美分。读取100万碱基的成本约为1美分。
施特劳斯相信,读写DNA的成本未来几年将会大幅下降。她表示,已有证据表明,这一成本的下降比过去50年中晶体管制造成本降低的降速更快,而晶体管成本的下降是计算技术创新的动力。
2007年,对人类基因组的测序耗资约1000万美元,但到2015年这一成本已下降至1000美元。
Q:本次微软利用DNA存储技术一共保存了多少容量的数据?
A:约200MB。
Q:本次微软DNA存储的数据中包含了哪些知名内容?
A:其中包含《战争与和平》,以及另外99部经典文学作品。
Q:除了微软,还有哪个机构参与了本次DNA存储的研究项目?
A:华盛顿大学也参与了该项目。
Q:微软为什么要研发DNA存储技术?
A:当前电子存储设备的发展速度赶不上全球数据量的增长,无法在可承受的成本内保存所有需要保存的数据,而DNA存储拥有远高于传统存储技术的存储密度。
Q:IDC预计到什么时候,全球保存的数字化数据将达到16万亿GB?
A:到明年。
Q:根据微软研究员的估计,多少DNA就能保存100个大型数据中心的全部数据?
A:一个鞋盒体积大小的DNA就足够。
Q:和传统长期存储介质磁带相比,DNA存储在耐久性上有什么优势?
A:DNA在干燥寒冷的环境下拥有极好的耐久性,保存几十万年依然可以保留信息,而磁带保存数据只有几十年时间就会老化。
Q:阻碍DNA存储技术大规模商业化应用的核心问题是什么?
A:核心障碍是成本,目前定制合成DNA分子的成本仍然很高,想要将DNA存储的成本降到低于作为长期存储标准介质的磁带,难度很大。
Q:把数据存储到DNA中,基本的技术原理是什么?
A:需要将原本二进制的0和1数据,转换为由四种核苷酸(碱基)组成的DNA序列来保存信息。
Q:微软对DNA存储技术成本的未来走势是什么判断?
A:微软认为未来几年DNA读写的成本将会大幅下降,目前已有证据显示,该成本的下降速度比过去50年晶体管制造成本的下降速度更快,而成本下降足以推动该技术的创新与应用。
