《数学技术之生物计算(四)》DNA和RNA及其计算
作者:张建中
DNA和RNA及其计算
DNA(Deoxyribo Nucleic Acid),脱氧核糖核酸的简称,由脱氧核苷酸组成的大分子聚合物,经碱基、脱氧核糖和磷酸构成,是生物细胞内含有的四种生物大分子之一核酸中的一种、生物体发育和正常运作必不可少的生物大分子。DNA分子结构中,两条多脱氧核苷酸链围绕一个共同的中心轴盘绕,构成双螺旋结构。脱氧核糖-磷酸链在螺旋结构的外面,碱基朝向里面,两条脱氧核苷酸链反向互补,通过碱基间的氢键形成的碱基配对相连,形成相当稳定的组合。
RNA(Ribo-Nucleic Acid),核糖核酸的简称,一般为单股长分子,是存在于细胞生物遗传讯息的中间载体、并参与蛋白质合成,还参与基因表达调控。RNA普遍存在于动物、植物、微生物及某些病毒和噬菌体内,对一部分病毒而言,RNA是其唯一的遗传讯息载体。
DNA可分为很多小段,每一小段都具有专一的遗传性状及功能,这些小段称为“基因(gene)”。基因的化学本质是DNA,有时也可是RNA,是控制生物性状的遗传物质的功能单位和结构单位,是有遗传效应的DNA片段。基因在染色体上呈线性排列,每个基因中可以含有成百上千个脱氧核苷酸,其排列顺序就代表遗传信息。生物的多样性,往往在百分之零点几甚至更低的微小基因差别上,只要有一条基因不同,长出来的生物就会有很大的区别。
DNA(脱氧核糖核酸)是生物细胞内携带有合成RNA(核糖核酸)和蛋白质所必需的遗传信息的一种核酸,是生物体发育和正常运作必不可少的生物大分子;DNA中的核苷酸中碱基的排列顺序构成了遗传信息,可以通过转录过程形成RNA,然后其中的mRNA通过翻译产生多肽,形成蛋白质。脱氧核苷酸由碱基、脱氧核糖和磷酸构成,其中碱基有4种:腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。DNA传递给RNA,再从RNA传递给蛋白质的转录和翻译过程,以及遗传信息从DNA传递给DNA的复制过程,为生物学中的中心法则。某些病毒中RNA同样可以反过来决定DNA,为逆转录,是对中心法则的补充和完善。
在细胞分裂之前,DNA复制过程复制了遗传信息,避免了在不同细胞世代之间的转变中遗传信息的丢失。在真核生物中,DNA存在于细胞核内称为染色体的结构中;在没有细胞核的其它生物中,DNA要么存在于染色体中,要么存在于其它组织中。细菌有单环双链DNA分子,而病毒有DNA或RNA基因组。在染色体中,染色质蛋白如组蛋白、共存蛋白和凝聚蛋白将DNA在一个有序的结构中。这些结构指导遗传密码和负责转录的蛋白质之间的相互作用,有助于控制基因的转录。
DNA使细胞核中携带生物生长指令的遗传物质,拥有不可思议的资料存储功能,可能比硅晶片更强。一般而言,1毫克DNA的存储功能大约相当于1万片的光碟片,更为不可思议的是DNA还具有在同一时间处理数兆个运算指令的能力。将生命活动的指令进行编码的遗传分子DNA和RNA里可以储存比常规存储芯片多的数据。试管状的生物计算机中含有大量的遗传物质片断,每一个片断就是一个微型计算工具,因此生物计算机能同时进行数千次甚至上百万次计算。
细胞是生物体最基本的结构和功能单元,蕴含了大自然千万年进化所沉淀的智能,其中DNA分子具有存储容量大、存储密度高、自组装等特点,是信息处理值得探索的理想载体。
RNA是由核糖核苷酸经磷酸双酯键缩合而成长链状分子。一个核糖核苷酸分子由磷酸,和构成。RNA的主要有四种,即(A)、(U)、(G)和(C),另外还有多种特殊碱基存在于特定类型RNA。
在细胞中,根据结构功能的不同,RNA主要分三类,即tRNA、rRNA和mRNA。mRNA是依据DNA序列转录而成的蛋白质合成模板;tRNA是mRNA上遗传密码的识别者和氨基酸的转运者;rRNA是组成核糖体的部分,而核糖体是蛋白质合成的机制。
与DNA不同的是RNA一般为单股长分子,但在一般水溶液中会形成分子内双螺旋结构。此外,RNA本身也需要通过碱基配对原则形成一定的二级结构乃至三级结构来行使生物学功能。RNA的碱基配对规则基本上和DNA相同,不过其中尿嘧啶在配对上的作用,相当于DNA中的胸腺嘧啶。
DNA与RNA在组成、空间结构、存在部位、合成方式和功能作用五个方面存在不同:
1、组成不同
DNA的组成单位是脱氧核苷酸,组成碱基是ATGC,组成五碳糖是脱氧核糖。
RNA的组成单位是核糖核苷酸,组成碱基是AUGC,组成五碳糖是核糖。
2、空间结构不同
DNA是双螺旋结构,分子由两条反向平行的多聚核苷酸链围绕同一中心轴盘曲而成,两条链均为右手螺旋,链呈反平行走向。DNA双螺旋结构的稳定主要由互补碱基对之间的氢键和碱基堆积力来维持。
RNA是单链,是以DNA的一条链为模板,以碱基互补配对原则,转录而形成的一条单链。
3、存在部位不同
DNA在真核细胞中,主要存在于细胞核内,少量存在于细胞质中。原核细胞中,主要存在于拟核内,少量存在于细胞质中,也存在于DNA病毒中。
RNA主要分布在细胞质中或RNA病毒中。
4、合成方式不同
DNA的合成方式是DNA复制和逆转录方式。
RNA的合成方式是DNA转录和RNA复制。
5、功能作用不同
DNA的作用是贮存决定物种的所有蛋白质和RNA结构的全部遗传信息;策划生物有次序地合成细胞和组织组分的时间和空间;确定生物生命周期自始至终的活性和确定生物的个性。
1999年人类基因组计划的科学家宣布译出首对人体染色体遗传密码,这是人类科学领域的又一重大突破。人类基因组计划是人类历史上与曼哈顿原子弹工程及阿波罗登月计划齐名的人类三大科学工程之一,但其价值和对人类社会的影响将远远超过前两个计划。2000年人类有史以来第一个基因组草图绘制完成,参与人类基因组计划的六国科学家联合公布了人类基因组图谱及其分析结果,绘制出完整的人类基因组图谱,破译出人类全部遗传信息。这一计划的实施为人类自身疾病的诊断和防治提供依据,给医药产业带来不可估量的变化,将促进生命科学、信息科学及一批高新技术产业的发展。
生物技术,在二十世纪得到空前的发展,特别是DNA双螺旋结构的发现和人类基因组计划的实施,更使得生物技术成为21世纪高新科技的主流。由于生物技术能够揭示生物构造和遗传的秘密,对于促进人口与健康、农业高新技术、生态环境、食品和化学工业等领域的发展具有重大作用,因而具有广阔的发展前景。
DNA计算(DNA Computing),是指基于大量DNA分子自然的并行操作及生化处理技术,通过产生类似于某种数学过程的一种组合结果并对其进行抽取和检测来完成问题求解的过程;DNA计算研究涉及许多方面,如DNA计算的能力、模型和算法等。最近也有学者开始将DNA计算与遗传算法、神经网络、模糊系统和混沌系统等智能计算方法相结合。DNA计算的许多研究有待着各个学科的合作研究,如生物学、化学、计算机科学、数学和工程学等,目前许多领域的科学家正在协调合作将这一理想变为现实。
尽管生物学和数学各有各自的研究领域和内涵,但近年来,由生物学和数学这两大领域交叉得到了一个跨学科的领域——数学生物学。数学手段可用于研究生物学,生物学工具也可用来解答数学问题。从这里可看出,数学生物学的思想包含着两个过程:
① 生物体所具有的复杂结构,实际上是编码在DNA序列中的原始信息经过一些简单的处理后得到的,或者说经过一系列DNA简单操作可得出一个复杂的结果;
② 求一个含变量w的可计算函数f (W) 的值,也可以通过求一系列含变量w的简单函数的复合来实现,即通过对w运用简单的函数关系可获得对w的复杂函数 f (W) 的结果。
DNA计算的优势包括:(1)并行计算能力强,运算速度快,能在多项式时间内解决复杂的计算问题;(2)适于研究涉及生命科学的问题;(3)抗电磁干扰强;(4)耗能少,仅需保证一定条件,反应就可持续;(5)DNA存储能力强。
DNA计算面临的挑战有:(1)由于动力学和热力学的原因,大量计算中难免会出现“伪解”;(2)目前DNA计算大多在试管中实现,难以芯片化;(3)某些步骤要求高于一般生化反应的操作水平;(4)分子生物操作所需要的时间长。
DNA计算,在电子计算机的摩尔定律一步步将硅芯片技术逼至极限的同时,以DNA计算为代表的非传统计算技术将得到更多重视和投入,只是简单堆砌DNA分子以扩大反应规模难以给这项技术带来质的飞跃,真正的飞跃还有赖于分子生物学和生物信息学这一交叉学科的突破。
DNA计算的研究属于生物学、遗传学、化学、数学、物理、计算机科学、控制论和智能科学等学科的交叉领域,内容深奥、涉及的范围很广。目前,DNA计算的研究内容主要集中在以下几个方面。
(1) DNA计算的生物工具和算法实现技术;
(2) DNA计算的模型主要考虑各种DNA计算的理论模型,讨论它们的计算能力和数学实现;
(3) DNA计算机的基本计算主要研究DNA的布尔电路运算、数字DNA、算术运算、分子乘、分子编程和应用等方面;
(4) DNA计算与软计算的集成基于DNA机理,阐述DNA计算与软计算集成的技术和方法,主要有面向智能系统的人工DNA模型、基于DNA机理的智能系统和基于人工DNA模型的计算智能理论及其应用方法,并将其应用于智能系统的在线学习、优化和控制;
(5) DNA智能计算学者认为,DNA计算的研究为人类研制分子计算机奠定基础。
基于DNA计算的智能系统将会架设DNA计算与智能系统研究的桥梁,在DNA智能计算机等相关研究中起一些垫脚石作用。DNA计算与软计算的集成,将为DNA智能计算机提供一条很好的实现途径。DNA智能计算机可彻底解决现有计算机所无法实现的智能运算功能。
生物技术应用(Biotechnology applications)是指利用生物技术对生物有机体研究、制造的各类产品在工程、农业,医药和其它领域在各个方面的应用。
生物技术需要纯生物科学(遗传学,微生物学,动物细胞培植,分子生物学,生物化学,细胞生物学等)以及生物学外的领域(化学工程,生物加工工程,信息技术,生物机器人)的知识。相反,现代的生物科学(包括分子生态学概念)是和生物技术的发展密切相关的DNA和RNA技术,还包括遗传工程和细胞及组积培植技术。
生物技术在四个主要工业领域的应用,包括医疗保健,谷物生产和农业,谷物非食品利用和其它产品(生物所能分解的塑料,植物油,生物燃料)及其环境的使用,如生物技术的一种应用是直接用有机体生产有机产品。另外的个例是生物浸矿采矿工业用已有的细菌,生物技术还用到回收、废品处理和清理污物等方面。
兰色生物技术是一项用到海里和水生应用的生物技术,使用较少。绿色生物技术是一项用到农业生产的技术。一个例子是通过微细菌增殖,选择和驯化植物。另一例子是设计转基因植物在有或无化学药品特别环境中生长。希望绿色生物技术可产生比传统工业和农业更好的效果。红色生物技术是应用医药方面的技术,一些例子是设计生产抗菌素,以及改变基因治疗疾病的基因工程。白色生物技术,也称工业生物技术,是应用到工业生产的技术,例子是设计一个有机体去产生有用的化学医药。
现代生物技术在医药方面应用有:
遗传药理学研究个体遗传如何影晌人体对药物的反应,着眼点在于能设计和生产适合每个个体遗传特性的药物。
制药产品:大多数传统制药用简单分子,由经验处理疾病的痛症得来。生物制药用生物大分子,如蛋白和从疾病产生的机理有针对性地选用,是一个相对年轻的工业。小分子用化学制造,但大分子要用在人体内的活细胞,如细菌细胞,动物或植物细胞。小细胞的药可制成药片;但大分子的药则要注射。
基因测试可直接试验DNA 分子本身,可测出它是否有变异。基因疗法可用正常基因补充或替换有缺陷的基因治病。
克隆包括从一个细胞把核移出来放到一个未受精的卵细胞中;这个卵细胞的核或者被移走,或已不活动。
克隆分二种:1. 复制克隆:经一些分裂后,卵细胞放入子宫内,并可发展成胎儿;2. 治疗克隆:卵放入一个佩斯里碟内,在这里它可发展成胚胎的干细胞,它可能治儿种病。
农业应用:1. 谷物生产:利用一或二种基因转给谷物,可使它具有增加产量的性质,是现代生物技术在农业最明显的应用;2. 减少谷物受环境影晌:希望找出能抗风,抗盐碱、干旱等自然灾害的基因,传输给谷物,使它们减少受环境的影晌;3. 增加营养质量:改善食物的味道、织构和外形,减少对肥料、农药和其它农业化学药品的依赖;4. 栽培新的谷物品种。
对人口、食物、环境、能源等问题进行综合研究,开创各种综合解决这些问题农业生态工程的兴起,最终将发展新的、大规模的近代化农业。由此可以看到,生物科学的发展,DNA与RNA的深入研究,和人类的未来发展关系密切,息息相关,且极其重要。