全基因组水平基因分型方法

3/10          本期作者:大胖丫

高通量测序和分析技术对育种家来说是一种高效的基因分型方法。该技术应用广泛,不管是全基因组水平的分析还是日常筛选,都能够提供准确稳定的结果。基于高通量测序技术的基因分型方法包括全基因组水平重测序、SNP芯片检测以及简化基因组测序等方法。今天就借一篇刚发表在TAG上的综述文章(doi.org/10.1007/s00122-018-3056-z),来对这几种方法进行简单介绍。

1. 基因组水平重测序

该方法一般是需要一个相对完善的参考基因组序列,不同样本先比对到参考基因组上,然后以参考序列为媒介再进行样本之间的遗传变异检测。遗传变异一般包括核苷酸变异(NVs)和结构变异(SVs):NVs一般包括单个或几个连续氨基酸的差异以及小片段的插入缺失(InDel,小于50bp),但InDel在NVs里的比例相对较少,比如对320份大豆的重测序共鉴定出了11M NVs,InDel只有不到10%;SVs是指大片段(>50bp)结构变化,主要包括删除、插入、到位、异位和拷贝数变化等。SVs的检测一般有三种方法:利用测序数深度的变化、利用paired-end的测序信息和利用剪切位点。利用测序深度的变化可以检测目标区段的删除(没有read比对到参考序列中)、拷贝数(测序深度不均一)以及异位(没有read比对到原始位置,但可以比对到插入位置)等变异;paired-end的序列由于在物理上是相邻的,两个read之间的距离也可通过建库大小进行判断,如果两条read之间的距离有明显变化则可以认为目标区域出现了插入或缺失;而对于其它类型的SVs,也可以利用paired-end之间的配对关系是否发生异常进行判断;剪切位点的变化主要是用来检测结构变异所造成的断点或着连接点。虽然测序成本大幅度下降,但对于大群体的全基因组水平变异检测来说,成本依然高昂。同时,由于测序数据十分庞大,存储及分析都需要消耗大量的计算机资源。

2. 基于重测序的SNP芯片

重测序技术可以进行大规模的SNP检测,基于这些SNP信息可以设计SNP芯片。SNP芯片是利用已知SNP位点两侧的特异序列设计探针,并将探针固定在固定相或芯片上,然后再将样本的DNA片段化后与芯片杂交并扫描杂交信号,从而鉴定某一位点的基因型。主要有两家公司在做,一个是Affymetrix,另一个是Illumina。目前在作物上有很多成熟的SNP芯片,比如水稻上的44K、50K和700K,玉米的50K和600K,小麦的90K、660K和820K等(doi.org/10.1016/j.molp.2017.06.008)。尽管SNP芯片的开发比较困难,但由于现成的SNP芯片操作简单、价格低廉并且稳定性很高,在遗传多样性检测、进化、全基因组关联分析和分子标记辅助选择育种等方面应用广泛。SNP芯片也有其局限性,其一就是只能检测已知的多态性位点,即无法检测未知SNP;其二对于多倍体物种(比如小麦)、结构变异较多、遗传多态性较高或重复序列区域的检测准确度有所下降。

3. 简化基因组测序(reducedrepresentation sequencing)

由于全基因组测序成本较高,并且数据处理也更加复杂,简化基因组其实就是利用一些特殊的方法,比如用限制性内切酶进行酶切以富集特定基因组区域(GBS, genotyping by sequencing)或者利用目标区域捕捉(targetedsequencing)进行测序,对全基因组进行简化,然后再进行测序和多态性位点的鉴定,其测序和数据处理的成本大幅度下降。简化基因组测序不需要已知的多态性位点信息,其本质还是测序,通过测序来鉴定遗传变异。

(0)

相关推荐