密码子优化名词解释及原理
密码子优化是一种通过增加靶基因的翻译效率来提高生物体内蛋白质表达水平的新技术。通常会通过避免稀有密码子,利用偏爱密码子(Preferred codons)、简化mRNA的二级结构、优化重复序列、消除限制酶切位点、调整GC含量等方法重新设计基因,以提高翻译效率,进而提高蛋白表达水平。。
为什么密码子使用很重要?
蛋白质翻译和合成依赖于tRNA。tRNA与核糖体结合并将氨基酸传递到核糖体,并在核糖体中将其掺入到增长的多肽链中。tRNA的一部分包含反密码子,这是与mRNA序列互补的三个核苷酸序列。tRNA的3'末端与对应于反密码子序列的氨基酸结合。这意味着有61种可能的tRNA。然而,细胞可能不能表达完全61种tRNA,并且表达tRNA的水平可能存在明显差异。由于tRNA表达的这种变化,编码蛋白质的密码子可能会影响翻译效率,进而影响蛋白质表达。实际上,研究表明,翻译效率与大肠杆菌和酿酒酵母中所有内源基因的密码子偏好相关。
1.密码子偏好性
密码子偏好性是指不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码子使用频率并不相同。(举例来说,大肠杆菌中某个氨基酸,编码该氨基酸的密码子有两个,AGG 和ATG ,而大肠杆菌偏爱用 AGG去指导氨基酸的合成。)
细胞内对应于稀有密码子的tRNA较少,高频率使用这些密码子的基因翻译过程容易受阻,大大降低蛋白表达水平。若是在基因的同义密码子使用频率与表达宿主相匹配的情况下,蛋白的表达水平则会显著提高。1980年代后期,科学家根据高表达基因的参考文献中的密码子使用频率创建了密码子适应指数(CAI),通常情况下,CAI<0.80被认为需要进行密码子优化。
优化后,CAI=0.96
此外,还需要考虑密码子的组合使用效率。通常情况下,考虑到高频和次高频密码子的组合使用效果会更佳。
2.mRNA二级结构
如果mRNA二级结构复杂且稳定,将会影响翻译效率,尤其是序列里有和核糖体结合位点或翻译起始位点互作的序列,会阻止翻译的进行,合理优化翻译起始区的mRNA二级结构,将有效提高目的蛋白表达水平。
3.限制性酶切位点的去除
限制性酶切位点需要根据克隆方案进行个性化排除,以免酶切位点产生冲突,影响构建表达载体的操作。
4.GC含量
GC含量是影响表达的另一重要因素,相比较AT间的2个氢键,GC间存在3个氢键,所以GC直接影响DNA的稳定性。高GC含量会间接降低蛋白质表达
密码子优化后,GC含量=51%
5.翻译起始与终止效率
翻译过程可以分为起始、延伸和终止三段时期。首先,起始阶段的顺利进行决定了蛋白表达量从0到有。对于翻译的起始。
高效的延伸阶段决定了蛋白质能够积累的量。如果mRNA有很多成簇的稀有密码子,会不利于核糖体的运动速度,进而降低翻译效率。
翻译终止是最容易被忽略的一步。有研究表明终止效率很大程度上影响蛋白表达水平,提高翻译终止效率将会显著提高蛋白表达水平。