随着生物计算机技术的发展,越来越多的新型存储媒介进入我们的视线之中。2007年就有日本科学家成功使用细菌DNA储存数据,可保存千年;我们之前也向大家介绍过螃蟹计算机 和 用细菌制造硬盘 ,其理念都颇具科幻感。近日,哈佛大学威斯研究所(Harvard`s Wyss Institute)的生物工程师和遗传学家成功开发了一项新技术,可以将约700TB的数据储存进1克DNA之中,将之前使用DNA存储数据容量的纪录提高了1000倍。

这个由乔治·切齐(George Church)和瑟里拉姆·库苏里(Sriram Kosuri)领导的团队把我们的DNA完全当做了数字硬盘,他们合成了一个可存储96比特数据的DNA链,具体存储方法是为腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶分别赋予二进制值(胸腺嘧啶和鸟嘌呤=1,腺嘌呤和胞嘧啶=0),随后通过微流体芯片对基因序列进行合成,从而使该序列的位置与相关数据集相匹配。当需要对数据进行读取时,只需再将基因序列还原为二进制即可。为了方便读取数据,研究人员还在每一个DNA片断的头部加入了19比特的地址块(address block),用此记录其在原始文件中的位置。

DNA硬盘:1克能存700TB数据-萌草酱

把DNA作为储存介质并非首次尝试,科学家们对它其实觊觎已久。DNA作为储存介质的优点有三:

  1. 体积小。一个碱基只有几个原子大小,人们以此为基础进行数据存储,整体的体积将大大领先于传统硬盘。
  2. 密度大。一个DNA片段就含有无数个碱基。
  3. 稳定性强。相比于其他需要低温、真空保存的存储介质,DNA可以在不苛刻的条件下保存上百年。

得益于微流体技术的发展,合成、排列DNA成为了一项较为简单方便的工作。在此之前,人类基因组计划(Human Genome Project)为了研究一个含有30亿对碱基的人类DNA组要耗费数年的时间。现在,在微流体芯片的帮助下,这项工作只要几个小时就能完成。

设想一下,1克DNA不到指尖上一滴露珠大小,却能够储存700TB的数据,相当于1.4万张50GB容量的蓝光光盘,或233个3TB的硬盘(差不多要151千克重)。切齐和库苏里在试验中将切齐的新书复制了700亿份储存在DNA中,数据总量达到44PB。

之前也有许多研究DNA存储的科学家尝试在活体细胞的基因组中书写数据。但细胞不仅会死亡,而且还会分裂复制,这对其中存储的数据都是致命性打击。此番切齐和库苏里根本没有使用细胞,他们使用了人造合成的DNA,绕开了之前的问题。虽说利用活体细胞DNA储存数据无法逃开细胞死亡和细胞分裂的问题,但毕竟可以在短时间内保障数据的安全,在某种特殊情境下(比如007系列电影内)完全可以采用。当然,切齐和库苏里的科研成果更符合现实社会的需求。

目前,囿于储存空间的紧缺,网站的资料备份通常只会保存数月乃至数周。等到DNA存储技术成熟,我们就可以把全人类的信息资料都存储起来。人类可以在每一寸土地上安装摄像头,将每一处每一分每一秒上发生的事情都记录起来。人类还可以把所有的图书、资料、视频信息统统储存起来,几百公斤的DNA就能够胜任这个“全人类”的工作。

对该技术有兴趣的同学可以点击 这里 阅读论文原文。


文章编译自Extremtech: Harvard cracks DNA storage, crams 700 terabytes of data into a single gram
作者: Sebastian Anthony