祖传的双链DNA,反正闲着也是闲着,不如拿来装书、存电影?
如果让你给千年后的世界留下这个时代的讯息,你会选择用什么样的方式呢?
写在纸上?难以保存。
刻在石头上?保存久,但容量有限。
存进电子芯片?容量大了,但长期放置不用,数据容易消失。
……
难道就没有一种更靠谱的存储介质吗?别急,大自然早已给我们准备了一套精妙的存储方案。
它诞生自亘古,跨越亿年延用至今,各类生物纷纷表示“真香”;
它有长达521年的半衰期,让长期保存不是笑谈;
它的装载量惊人又不占空间,1g就中能装进一千亿张 DVD 光盘的内容,1kg能装下全球所有的信息数据[1]!
没错,它就是谱写生命密码的DNA。
流行语我都懂,但具体要怎么实现?| bilibili网页截图
“小维纳斯”的诞生
DNA存储并不是一个新鲜的概念,早在1960年代中期,苏联物理学家米哈伊尔·萨米奥维奇·纽曼(Mikhail Samiolvich Neumann)就大胆设想用DNA作为数据存储载体,可惜1970年前尚不会合成DNA,甚至连怎样阅读生物DNA中的信息还八字没一撇(初代DNA测序技术到1977年才出现)。因此,在很长的一段时间里,写进DNA的浪漫只能在科幻故事里出现。
真正在技术上第一次把人类文明写进DNA,始于1988年的一场艺术与科学的碰撞。
麻省理工学院的科学艺术家乔·戴维斯(Joe Davis)参考古老的日耳曼符文,用简单的线条设计了一个代表生命(life)和女性地球(female earth)的“基因艺术品” ——小维纳斯(Microvenus)[2]
通过和哈佛大学的研究者合作,这个有着“繁育女神”意味的符号被转换为简单的二进制代码(0代表亮点,1代表暗点),随后他们按数字0或1重复的次数来定义对应的碱基,即:
C=X,
T=XX,
A=XXX,
G=XXXX.
(例如其中的一段二进制编码10101011100010000100001000010000100,便被翻译为DNA序列CCCCCCAACGCGCGCGCT。)
戴维斯将这段编译着符文的DNA导入大肠杆菌中,伴随着大肠杆菌的每一次复制分裂,“小维纳斯”便成为永生的艺术。
戴维斯在论文中展示的'小维纳斯'形象 | 参考文献[2]
“打破印刷记录”的丘奇之书
随着21世纪的到来,DNA合成和测序技术也有了跨时代的飞跃。当科学的齿轮咬合,技术这架马车缓缓启动,曾经前卫的艺术品便成为了拉动变革的那只手。
DNA存储量和电子存储的比较 | Nature
2012年,哈佛大学的合成生物学家乔治·丘奇(George Church)率先率领团队将自己的一本659kb的书顺利存进了DNA中,这便是在合成生物学领域颇具盛名的丘奇之书,这本书中有53426个单词,11个JPG图像和一个JavaScript程序[3]。只需要通过DNA测序技术重新获得碱基排列顺序,再反向把碱基翻译回二进制,就可以通过电子设备进行阅读啦。
这里还有一个有趣的梗,因为含有丘奇之书的DNA 被导入了大肠杆菌,并通过大肠杆菌的增殖得到了 900 亿份复制品,于是这本书真真切切的成了出版史上被“印刷”次数最多的一本书!
丘奇对DNA存储领域的贡献并未止步于增加“书”的厚度,他与合作们还实现了从文本信息存储到视频信息存储的突破。
借鉴天然状态下三碱基编码20种氨基酸及终止密码子,丘奇等人将21种颜色信息与三种碱基的排列进行组合对应(下图),再命令C=00, T=01, A=10,G=11,将碱基序列转化为二进制序列(下图)[4]。通过这种方式,丘奇等人顺利实现了图片存储。
丘奇等人使用的图片编译方法 | 参考文献[4]
丘奇等人编码所用图片及从DNA序列中重新解码后获得的结果 | 参考文献[4]
通过进一步精简编译方式,直接用四位二进制数对应三个碱基的组合,丘奇团队还将一张“奔跑的马”的GIF格式的小动画存进了DNA里。
丘奇等人使用的GIF编译方法 | 参考文献[4]
“奔跑的马“GIF | 参考文献[4]
推动DNA存储技术发展的并不只有丘奇的团队,其他诸多研究团队也做出了杰出的贡献。而被写入DNA中的,不乏许多非常有纪念意义的历史资料,譬如DNA的莎士比亚的十四行诗、马丁·路德金的演讲原声等等,这些或许也是科学家们的赤子之心吧。
散发着工业的气息的“斯坦福兔兔”
想让DNA存储从实验室走到寻常百姓家,合适的DNA“容器”必不可少。毕竟让大家在家里培养大肠杆菌、提取DNA不太现实。
那么,未来的DNA存储器会是什么样子的呢?
兔兔那么可爱,不如就把它做成兔兔吧!
3D打印斯坦福兔子GIF | 参考文献[5]
2020年,一只看似平平无奇的3D打印版斯坦福兔子(Stanford Bunny,是一个常用的计算机图形三维测试模型)在苏黎世联邦理工学院的实验室中诞生[5]。
在这只兔兔的身体里嵌着数以万计微小珠子,而每颗珠子内都有几十个DNA 分子,科学家们将打印兔兔的蓝图直接存进了这些DNA里,因此这只兔兔的体内包含着3.7亿份“克隆”自己的数据代码。从它身上取下一小块,获得DNA,再解码并复制其中的信息,便能制作出下一代的兔兔(没错,就是套娃兔行为!)。
这便是苏黎世联邦理工学院罗伯特·格拉斯(Robert Grass)和以色列亚尼夫·埃利希(Yaniv Erlich)实验室的DoT(DNA of Things)构架,即将DNA分子融合到一种功能性材料中,从而创建具有存储功能的实物,除了斯坦福兔兔,这些科学家们还制作出存有视频的眼镜。
内含DNA的3D打印兔 | 参考文献[5]
这项技术的魅力不仅在于实现了DNA存储的实体化,更在于其中使用的“DNA喷泉(DNA Foutain)”保障了极高的储存量和容错量,使得缺失了80%的信息依然可以正确解码文件。复制到第五代的兔子依然保存着和初代完全一样的外形,这就说明信息在经过五轮的传递依旧高保真!
兔兔经过多代复制后保存稳定 | 参考文献[5]
新时代前的巨石
斯坦福兔兔或许能带着我们蹦蹦跳跳的闯进DNA存储的新时代,但前方依旧有不少难题亟待科学家们解决。
第一道门槛就是价格,当前的DNA存储实在是太烧钱了!
要知道,DNA目前的合成成本在3元一个碱基!在建国70周年时,华大基因曾将记录着开国大典的一段视频存进了DNA里,仅仅十几kb就花费了近四万元人民币!
但是希望还是有的,华大基因公司预测DNA合成成本正以每年3-4倍的速度下降,美国Catalog公司也大胆预测未来进行1MB数据DNA存储成本将不到0.001美分。
目前的DNA存储技术还十分“烧钱” | Pixabay
其次,DNA存储及读取的速度都不如人意,目前比较快的记录是Catalog公司存入数据的速度4Mbps,尽管一天便可装满一个手机的内存,但显然还有很大的提升空间。
DNA存储还有一个非常令人头疼的问题,那就是不方便灵活的存储及调用,更难以修改,虽然现在研究员们已经想到了通过加标签序列的方式提高信息读取的效率,但具体运用还有不小的阻碍。
无论如何,我们不妨保持着乐观美好的幻想,也许在不久的将来,我们便可以在赠与心爱之人的玫瑰中写入DNA编码的告白。
《月色真美》剧照
参考文献
[1] Extance, A.J.N., How DNA could store all the world's data. 2016. 537(7618): p. 22-24.
[2] Davis, J., Microvenus. Art Journal, 1996. 55(1): p. 70-74.
[3] Church, G.M., Y. Gao, and S. Kosuri, Next-Generation Digital Information Storage in DNA. Science, 2012. 337(6102): p. 1628.
[4] Shipman, S.L., et al., CRISPR–Cas encoding of a digital movie into the genomes of a population of living bacteria. Nature, 2017. 547(7663): p. 345-349.
[5] Koch, J., et al., A DNA-of-things storage architecture to create materials with embedded memory. Nature Biotechnology, 2020. 38(1): p. 39-43.
作者:一只哈代