设计工具
应用程序

DNA存储世界数据的惊人潜力

美光科技| 2020年3月

人类正处于前所未有的信息爆炸的尖端. 我们将如何处理我们产生的所有数据?

这不是一个无关紧要的问题. 我们的电脑, 智能设备, 电视, 恒温器, 家庭安全系统, 数字个人助理, 穿戴, 汽车, 机器人和其他设备正在以指数级增长的速度生成和使用数据.

五年前,我们的数字技术产生的所有数据总量为4.4泽字节(ZB). 这是4.4千万亿字节——相当多的信息. 今天, 我们已经超过了这个数字:我们现在每年生产大约16ZB, 到2025年, 这一数字预计将增加10倍.

我们收集、处理和存储这些数据,所用的微芯片主要由沙子中的硅制成. 虽然它是 地壳中含量第二丰富的元素, 纯硅——制造多种类型的计算机芯片所需的那种——是罕见的, 占总硅供应量的不到10%.

我们正在迅速地用完它. 据预测,到2040年,数据洪流可能耗尽全球计算机级硅的供应 一项研究这是对新技术和数字进步的重大挑战.

避免这种灾难的一种方法是改进硅的提纯工艺. 此外,研究人员正在寻求 替代的材料 用于数据处理和存储, 比如氧化镓, 二硒化铪和二硒化锆, 和石墨烯.

但在替代材料中还有另一种可能性—— 脱氧核糖核酸,或DNA.

大自然的数据处理机

每一个生物来到这个世界上,都带着一定的信息. 我们头发和眼睛的颜色, 我们的惯用右手或惯用左手, 我们易患的疾病, 甚至我们的性情也可能是遗传下来的, 哪些来自我们的基因. 基因由DNA组成,DNA携带着决定我们是谁和我们是什么的信息.

DNA的分子结构由双螺旋结构组成, 或者是两条分子链——一条是糖,另一条是磷酸盐——相互缠绕在一起. 线之间是氮基,形状像水平杆, 每一种都有不同的化学成分. 底座有四种:

  • 腺嘌呤(A)
  • 胸腺嘧啶(T)
  • 鸟嘌呤(G)
  • 胞嘧啶(C)

“人体是最复杂的信息存储器,Gurtej Sandhu说, 美光科技高级研究员兼副总裁. Sandhu在广泛的技术领域拥有1300多项专利. 他的个人兴趣和研究领域之一是利用DNA进行数据存储. 

他的灵感, 他说, 来自于意识到我们身体中单个细胞的DNA中包含的“大量”信息.

“大自然以相当惊人的规模进行数据压缩,其方式仍未完全被理解,桑德胡说。. “所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”

Gurtej Sandhu

“人体是最复杂的信息存储器.”

美光科技高级研究员兼副总裁

如何将数据存储在DNA上

DNA储存的诸多好处

随着科学家们对DNA分子的了解越来越多,并找到了制造合成版本的方法, 他们看到了很多希望. 一种被称为核酸记忆(NAM)存储的未来存储器可以提供许多好处.

密度:在一个人的DNA中存储的信息量是巨大的,Sandhu说. 我们的身体包含5TB(或五万亿字节)的信息. 根据Sandhu的说法, DNA的数据存储密度远远高于当今已知的任何其他存储技术.

下 一个系统, 一克DNA可以存储2.15亿千兆字节的数据, DNA的数量比一块方糖所能储存的还要少 所有的电影. 一个两辆客货车大小的DNA容器可以容纳世界上所有的数据.

这种密度的一个原因是DNA的四部分碱基——A, T, G和C——而不是现在计算机使用的基于0和1的二进制系统, Sandhu说. 这种倍增使得存储的信息量呈“指数级增长”. NAM存储器以分子形式对信息进行编码,将信息打包在非常小的包裹中.

耐用性: DNA可以保存很长时间 -最多1个.大约500万年后冻结在永久冻土中. 作为一种数据存储介质,它可以存活数千年甚至数百万年. 与此形成鲜明对比的是, 长期存储最常用的介质, 磁带, 10年后就必须更换吗.

可持续性:DNA, 甚至是将在不结盟运动中使用的合成材料, 只需要很少的能量来储存, 处理和读取. 因为它可以自我再生,所以它也是完全可回收的. 它可以很容易地被复制成许多个自身的副本.

“不结盟运动可以用更少的空间和能源为子孙后代储存世界信息,Sandhu和其他研究人员说, 包括乔治·M. Church、Victor Zhirnov和其他人在2016年的一篇文章中写道 自然材料文章 详细介绍他们的研究结果.

技术挑战

研究人员正在探索DNA的用途, 第一个, 作为医疗记录的长期存储技术, 监控录像, 历史文献及其他档案资料. 用磁带填充大量数据库的陈旧方法可以被相对少量的、持续时间更长的非编码所取代. 最终, 他们希望开发出纳米技术来完全取代计算机中硅的使用.

Gurtej Sandhu

“所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”

实现这一目标的主要障碍是成本.

“对于我们使用DNA读取、写入、打包和存储数据的应用程序,成本需要大幅降低,桑德胡说。. In one project, the cost of synthesizing 2MB of data was $7,000; reading it cost another $2,000. 读写DNA比其他类型的记忆存储要慢.

桑德胡乐观地认为,随着时间的推移,这些挑战将得到解决. DNA测序的价格已经大幅下降, 他指出, 从31美元,从2002年的每兆碱基250美分(或100万对DNA碱基对)到2016年的每兆碱基63美分. 对不结盟运动的研究正在加快. 在哈佛大学等研究机构的资助下, 欧洲分子生物学实验室和半导体研究联盟(或Symbio), 都在开发基于dna的数据存储技术. 博伊西州立大学和微软也有不结盟运动项目. 

光明的未来

如果今天发生计算机级硅耗尽的情况,可能会使世界陷入停顿. 考虑到我们生产数据的速度, 耗尽全球硅供应是一个真正令人担忧的问题, 但美光正在加紧解决这一挑战. 作为计算机存储技术的领先制造商, 我们处于一个非常有利的位置,可以带领大家朝着更好的方向前进, 快, 更可持续的数字存储解决方案.

Sandhu认为,基于dna的NAM可能很快就会准备好增强美光DRAM, 与非, 以及其他硅基存储技术. 总有一天,这种形式的存储可能会成为标准,完全取代硅.

Gurtej Sandhu

“对于我们使用DNA读取、写入、打包和存储数据的应用程序,成本需要大幅降低.”

与此同时, 发展不结盟运动的进程本身可以产生其他同样重要的结果, Sandhu说:

“想象一下100年前使用磁芯时的记忆,然后是电子记忆, 盘驱动器, 小磁存储器等. 对于这些内容,我们需要了解机械方面的知识.

“DNA要复杂10倍. 我们需要包容. 我们需要记忆,微流体,化学,分子生物学. 让这项技术发挥作用, 不同的人的合作数量和技术和科学参与的广度必须是巨大的. 这需要所有的技能来实现.”

微米是 内存制造商这就是为什么我们在想象和创造新的存储技术方面处于行业领先地位. 但要将这些技术推向世界,还需要不同领域专家之间的合作.

桑德胡说:“在过去,无论是在我们的行业还是其他行业,都没有这样的例子. “这将是一个绝佳的合作机会. 而我们仅仅触及了表面.”