群体遗传|同源片段追溯-IBD分析(一)
此部分着重简单介绍IBD的理论知识和应用范围,后期会介绍部分软件实操。
IBD介绍
要介绍IBD就要先从IBS说起。IBS-identity by state译为序列一致片段,是指在两个及以上个体间存在完全相同的DNA片段即为IBS片段;IBD-identity by descent译为同源相同片段,是在两个及以上个体存在来源于同一祖先的、未发生重组的、完全相同的DNA片段,这样的片段即为IBD片段。所以从定义来看,我们可以说一个IBD片段一定也是IBS片段,但一个IBS片段可以不是IBD片段。下面这张图形象地描绘了何为IBD
由图我们可以看出,C1和C2两个个体的基因组中橙色部分的DNA片段皆来自于A,所以该片段为IBD片段;但如果假设我们不考虑C1、C2的亲本和祖先,仅仅是在比较两个个体间的在遗传物质方面的异同,这时我们可以说橙色的部分为IBS。
IBD应用
由于IBD片段的能够反映个体间的遗传关系,所以IBD有非常广泛的应用。主要有以下几个方面:
检测性状变异;两两间的IBD片段和表型之间的相关性可用于检测基因组中是否含有影响性状变异的区域; 测定遗传力;我们可以先把遗传力狭义地理解为祖先个体中的某个或某几个决定关键性状的DNA片段是否能完全的遗传给子代。基于此,我们通过测定某一系谱内个体间的IBD片段的长度和数量就能够衡量出祖先个体这些片段的遗传力大小。 估计亲属系数;两个个体间IBD片段长度越大,数量越多,就说明这两个个体的亲缘关系越近;如果两个个体间间隔了很多代,它们之间的IBD片段长度普遍偏短,并且随着传代数的增加个别片段也会丢失导致数量减少。 鉴定精细的群体结构;基于个体间的亲缘关系。 推断驯化历史;有效群体越小,个体间的亲缘关系会更近,会有更多的IBD片段。较短的IBD片段反映了个体与共同祖先的亲缘关系比较远,传代数更长,时间更长,能够推测的有效群体偏小;而更长的IBD片段则能较为准确地反映最近的有效群体大小。 估计群体遗传参数;比如突变率、重组率、迁移率和选择压。突变是通过观察到的IBD片段单倍型的discordance;重组率则是endpoints;选择压是由群体内某一区域IBD频率决定的,频率越高,选择压越大。
IBD探测方法及软件
基于概率模型的方法:容错率高,不适用于非系谱群体;
基于IBS方法:准确度高,但对于突变位点过于敏感;
基于IBS+概率模型:调和上述两种探测方法间的矛盾;
IBD应用实例
挖掘控制农艺性状的候选基因 Han Z, Hu Y, Tian Q, et al. Genomic signatures and candidate genes of lint yield and fibre quality improvement in Upland cotton in Xinjiang[J]. Plant Biotechnology Journal, 2020. 选择压 Albrechtsen, Anders et al. “Natural selection and the distribution of identity-by-descent in the human genome.” Genetics vol. 186,1 (2010): 295-308. doi:10.1534/genetics.110.113977 驯化历史 Liang Z, Duan S, Sheng J, et al. Whole-genome resequencing of 472 Vitis accessions for grapevine diversity and demographic history analyses[J]. Nature communications, 2019, 10(1): 1-12.
参考资料
Identity by descent https://en.wikipedia.org/wiki/Identity_by_descent#cite_note-Albrechtsen.2010-21 Identical by descent https://isogg.org/wiki/Identical_by_descent Zhou Y, Browning S R, Browning B L. A fast and simple method for detecting identity by descent segments in large-scale data[J]. The American Journal of Human Genetics, 2020.
赞 (0)