引物设计原则和注意事项详解
1、引物最好在模板cDNA的保守区内设计。
DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。
2、引物长度一般在15-30碱基之间。
引物长度(primer length)常用的是18-27bp,但不应大于38bp,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应。
3、引物GC含量在40%~60%之间,Tm值最好接近72℃。
GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5-10℃。若按公式Tm=4(G+C+2(A+T)估计引物的Tm值,则有效引物的Tm为55-80℃,其Tm值最好接近72℃以使复性条件最佳。
4、引物3'端要避开密码子的第3位。
如扩增编码区域,引物3'端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。
5、引物3'端不能选择A,最好选择T。
引物3'端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3'端最好选择T。
6、碱基要随机分布。
引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3'端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。
7、引物自身及引物之间不应存在互补序列。
引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。
两引物之间也不应具有互补性,尤其应避免3'端的互补重叠以防止引物二聚体(Dimer与Cross dimer)的形成。引物之间不能有连续4个碱基的互补。
引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。
8、引物5'端和中间△G值应该相对较高,而3'端△G值较低。
△G值是指DNA 双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。应当选用5' 端和中间△G值相对较高,而3'端△G值较低(绝对值不超过9)的引物。引物3'端的△G 值过高,容易在错配位点形成双链结构并引发DNA聚合反应(不同位置的△G值可以用Oligo 6软件进行分析)。
9、引物的5'端可以修饰,而3'端不可修饰。
引物的5' 端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5'端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。
引物的延伸是从3'端开始的,不能进行任何修饰。3'端也不能有形成任何二级结构可能。
10、扩增产物的单链不能形成二级结构。
某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2'-脱氧GTP取代dGTP对扩增的成功是有帮助的。
11、引物应具有特异性。
引物设计完成以后,应对其进行BLAST检测。如果与其它基因不具有互补性,就可以进行下一步的实验了。
值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。
做Real Time时,用于SYBR Green I法时的一对引物与一般PCR的引物,在引物设计上所要求的参数是不同的。引物设计的要求:
(1)避免重复碱基,尤其是G。
(2)Tm=58-60度。
(3)GC=30-80%。
(4)3'端最后5个碱基内不能有多于2个的G或C.
(5)正向引物与探针离得越近越好,但不能重叠。
(6)PCR扩增产物长度: 引物的产物大小不要太大,一般在80-250bp之间都可;80-150bp最为合适(可以延长至300 bp)。
(7)引物的退火温度要高,一般要在60度以上;
要特别注意避免引物二聚体和非特异性扩增的存在。
而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。
circRNA(环状RNA)、LncRNA(长链非编码RNA)引物设计也遵循以上原则。