2017-06-02 11:42 来源:网友分享
据《新科学家》和《科学》杂志网站8月16日报道,哈佛大学的研究团队将一本遗传学课本的全部内容编码进一小段dna(脱氧核糖核酸)序列,确切来说,是将53400个单词、11张图片和一个java程序共计527万比特的数据存储在了不到1皮克(10-12克)的dna中。这项最新突破有可能彻底革新我们存储数据的能力。
dna是已知密度最高也最稳定的信息存储介质。理论上而言,dna的每个核苷酸可以编码两个比特,每克单链dna的存储容量可达455艾字节(1艾字节=10的18次方字节,1字节=8比特),大约相当于1000亿张dvd光盘的容量,存储密度几乎是闪存等现有数字媒体的五六百倍。而且,存储在dna中的数据时隔几千后年仍能够被读出。
此前曾有研究人员尝试过将数据写进活细胞的基因组内,但这种方法存在很多问题:首先,一旦细胞死亡,存储的内容将会丢失;其次,细胞会分裂复制,在这一过程中可能会产生新的变异,从而更改存储数据。此外,利用dna长序列读取和写入数据存在一定难度,而且成本很高,这使得利用dna进行大规模数据存储不太现实。
为了解决这些问题,哈佛医学院合成生物学家乔治・丘吉尔带领的研究团队不使用细胞,而是用喷墨打印机将化学合成的dna短片段嵌入到一个微小的玻璃芯片表面。他们将一本由丘吉尔参与编写的遗传学课本转换成“0”和“1”的比特形式,并用dna的4个碱基中的a或c来编码 “0”,g或t来编码“1”,从而将课本内容写入了dna中。这个dna芯片采用了类似于计算机硬盘分区的方式,将课本内容分散为数据块来存储。
读取这些数据则需要一个dna测序仪和一台计算机。由于每个dna片段中都包含着一个数字“条形码”,记录了其在原始文件中的位置,因此所有的片段可被重新组装,并转换成数字格式。电脑还能帮助纠错:每个数据块都被复制了数千次,通过与其他副本相比较,任何一个小错误都可以被识别并修复。
研究人员将课本内容存入dna,然后又重新转化为数字形式读出,结果显示,这个存储系统的底层读取错误率为每百万比特只有两个错误,可与dvd比肩,远远优于磁性硬盘驱动器。不过,由于数据编码是与dna合成同步完成的,因此这种方式不支持可擦写数据存储,但适用于长期归档存储。
研究人员表示,因受操作成本、速度(此次花了大约几天时间)和测序仪大小的制约,将dna作为一种通用的数据存储介质目前还不切实际,但这一领域正在快速发展,未来5年到10年内有望开发出比传统数字存储设备更快、更小、更便宜的dna存储技术。