新发现:DNA中神秘的第二层遗传信息

2003年4月15日,也是一个人类史上里程碑性质的日子,中、美、日、英、法、德六国元首或政府首脑签署文件,六国科学家联合宣布:人类基因组序列图完成。这意味着人类的基因里所有的碱基对序列都已经破译完成,似乎接下来的问题就只剩下怎么来具体应用了。然而事隔13年之后,最新的研究结果表明,密码破解的事情远没有完,DNA里还隐藏着第二层遗传信息,而最有趣的是,发现这一秘密的竟然是一群理论物理学家。

  理论物理学家们近日确定了一则轰动生物界的消息:我们体内的遗传信息不仅仅只储存在DNA的碱基序列中,还有另一部分取决于DNA折叠成为染色体的方式。具体而言,DNA的三维结构将决定基因的表达。

  这些其实是生物学家早就知晓的事情,他们甚至已经找到了辅助折叠DNA的蛋白质。但是现在却是一帮物理学家首次将其中的奥秘揭露真正出来,而他们借助的工具就是计算机模拟实验。

  在我们继续往下说之前,我们先来小小地科普一下。虽然这是很多科学家早就知道的事情,但也许很多读者对此仍旧不能说是完全知晓。

  让我们先回顾回顾高中课本,沃森和克里克与1953年发现了DNA的双螺旋结构,并确定我们的遗传信息就储存在由G、A、C、T四种碱基组成的碱基对序列中。

  这些序列将决定何种蛋白质将在何种细胞中生产。如果要说得再具体些就是每三个碱基决定了一个氨基酸,氨基酸手拉手组成肽链,最后肽链组合在一起,才是我们说的蛋白质。所以,如果你的眼睛是棕色的,那是因为你的DNA包含一段序列,在这段编码序列指导下生成的蛋白质,使你的眼睛变成棕色的了。

  以下是一段RNA提取DNA遗传信息,并且在核糖体内合成蛋白质的动画,整个场面宛如一个精密加工厂,无比神奇。

  但这并不是完整的机制,我们可以想象一下,我们身体中所有的细胞有的DNA起初都是一样的,为什么可以分化出不同的蛋白质来满足这么多有不同功能的器官的需要呢?我们胃部的细胞可能就不能产出使眼睛变棕色的蛋白质吧,但是它们却需要生产消化酶。那么这样的分工机制是怎样的呢?

  上世界80年代,科学家发现这种机制是由DNA在细胞内部的折叠方式控制的。此外环境的因素也是显著的,例如环境压力就能激活和沉默一些基因。

  DNA折叠其实是细胞最根本的控制机制。我们体内每个细胞都包含的DNA都长达2米多长,因此它们必须经过折叠才能稳定存在于尺寸极其微小的细胞内,成为染色体——就像一束束捆起来的绳索一样。

  而DNA折叠的方式就决定了那些基因将在细胞内是“可读取”的。简单而言就是,被折叠靠里的基因就“不可读取”,而在外侧的就“可读取”。通过这样的方式,不同的细胞可以决定需要去合成哪些蛋白质以满足不同的需求。

  近年来,生物学家已经开始罗列出决定DNA折叠的各种因素,以便分别研究。他们的研究方法包括着重研究某一段特定的序列,或是人为改变DNA的折叠后的结构。

  既然生物学们干得不错,那么理论物理学家为什么要来戗行呢?

  荷兰莱顿大学的一个研究团队已经能在基因组层面分析这种机制,同时借助于计算机模拟,他们已经确定这种折叠机制其实是作为遗传编码的一部分被写入DNA的。

  该研究团队是一群由赫尔穆特·斯奇萨尔(HelmutSchiessel)领导的物理学家,他们针对啤酒酵母和裂殖酵母的基因组做了计算机模拟。使用各种折叠机制随机决定了有着不同次级结构的DNA。

  通过计算机模拟,他们能看到DNA是怎样折叠的,也知道哪些蛋白质会被生产出来。研究结果进一步验证了他们的观点,折叠机制是遗传编码的一部分,其重要性不亚于碱基对顺序。

  2007年4月19日,实验员在紫外光下将DNA的一个片段切除出来,用作DNA测序。

  而这也意味着DNA变异的方式也不止一种:除了改变DNA的碱基序列以外,改变DNA折叠的方式则是另一种。

  研究人员就此解释道:“决定DNA折叠机制可以改变,进而改变DNA的折叠形态和碱基对密码的“可读取”性,最后蛋白质的合成也将受到影响。”

  这也是对许多生物学家早就知道的机制的一种肯定。而更加令人激动的是,在此次研究中起到重要作用的计算机仿真模拟带来了一种全新的思路——科学家们也许可以通过控制DNA折叠机制进而控制基因表达,比如说地将我们不想要的基因隐藏起来,例如一些致病基因。

  而这条路可谓路漫漫其修远兮。不过,越来越多的科学家都在做这方面的研究。随着对DNA可控折叠的深入了解,我们最终可以利用它的可能性也在一点点地变大。

  相关文章已经在学术期刊《PLOS ONE》上发表。

  关于具体的试验方法,摘要如下:

  这些理论物理学家,采用了物理学家常用的模拟仿真来模拟DNA折叠的形状以及DNA折叠过程中会产生的变化。如图所示是他们用来模拟DNA折叠形状的模型:“刚性圆盘模型”(Rigid Base Pair Model)。每一个圆盘代表一段DNA,能上下左右摇摆,共有6个自由度的变化。

  不同的颜色代表它们由不同的碱基对序列组成,因而有不同的物理化学性质,所以自由度的变化程度也不一样。图中红色的小点是组蛋白八聚体,是染色体中DNA的连接处。图中就是仿真中要用到的147-bp-DNA模型,其中引入了147个“小圆盘”。

  设置好模型的参数,接下来就是见证奇迹的时刻——跑仿真。

  贝赫鲁兹伊斯拉米莫萨兰(Behrouz Eslami-Mossallam)作为文章的第一作者,选取了理论物理常用的仿真手段:蒙特卡罗算法。这是一种与物质能量有关的算法,一般用于分子动力学的仿真,或是寻求多体系统的最低能量态。而这篇文章采用了后者的思路,选取了两个引入能量扰动的方式:改变空间结构以及改变碱基对序列的构成。你可以只选择改变空间结构,也可以只改变碱基对序列,或者两者一起发生变化。只需要选取要做出的改变,计算机就会自动地寻找该模型的最低能量态——即最稳定的状态。

  这看似简单的操作,背后蕴含的数学物理理论却是博大精深的,光是想象一下一个圆盘就有6个自由度,就可以知道这种多体系统的能量方程有多复杂了。而蒙特卡罗算法的应用层面可谓包罗万象,此前炒得火热的AlphaGo也是采用的此种算法。

(0)

相关推荐