基因组中是否存在未被DNA测序覆盖的区域（学徒翻译）

2024-08-04 15:39:33

原文链接：https://medium.com/musings-of-scientist/how-well-do-we-know-our-reference-genome-6a72ab4aa76e

如果基因组是一幅风景，你可以通过NGS创建该景观的地图，那么这幅地图肯定会有一些白色区域。换言之：一些基因组区域不能很好地被NGS技术测序的DNA所覆盖。在此，我们将解释这一点的重要原因。

重复DNA序列

重复DNA序列（例如串联重复序列）在许多物种中广泛存在。大约50％的人类基因组由重复序列组成（1）。重复是序列比对和组装程序的挑战，因为它们导致非常相似的短读取。它可以比作一个大拼图，其中一些拼图块可以放在几个地方。因此，重复会在比对和组装中造成歧义，反过来，它也会在解释结果时产生偏差和错误（1）。

G/C偏差

四种碱基（ACTG）在基因组中通常分布不均匀。具有高和低GC含量的DNA区域难以扩增，因为与具有混合碱基含量的DNA区域相比具有更高的稳定性。在这些情况下，DNA聚合酶易产生伪影。这些影响扰乱了大多数协议所需的扩增步骤。因此，来自具有高/低GC含量的区域的片段的表现不足，导致读取覆盖率低且不均衡（图1）。

一个常见的例子是恶性疟原虫，一种疟疾病原体。其基因组的一些编码区具有70％的AT含量。因此，直到最近，才有可能对寄生虫的基因组进行测序。目前的项目试图通过使PCR（扩增）产生的假象最小化或放弃扩增步骤（2）来改善这些区域的测序。

图1：在各种扩增条件下的全基因组碱基组成偏差曲线，线性尺度。图片来自（3）。

碎片偏差

如该文（https://www.ecseq.com/support/ngs/is-there-a-bias-after-dna-fragmentation）所述，DNA片段化是一个非随机的过程，特别是对于机械剪切方法。这导致各种基因组区域的不均匀覆盖，并且可导致欠/未覆盖区域。

总结

这些实例表明，使用NGS进行准确的DNA测序还存在许多技术难题需要解决。有时可以通过调整样品制备（例如DNA片段化）或测序过程本身（如恶性疟原虫所述）来减少问题。此外，为项目考虑不同的测序技术总是一个好主意。

之前发布了学徒招募，广受关注，得到了各路好友的大力宣传，大家对我是如何带学徒的细节比较感兴趣，所以简单介绍一些。

划重点！NGS中DNA建库方法全面解析 ——NGS上机前的样本处理方法，你选对了吗？

来源:翌圣生物科技(上海)股份有限公司 2019-8-11 HB181122 划重点!NGS中DNA建库方法全面解析 --NGS上机前的样本处理方法,你选对了吗? 高通量测序技术的飞速发展,测序 ...
里程碑：我们终于完成了对人类基因组的完整测序

majer @ 2021.06.06 , 17:37 二十年前,当人类基因组计划和生物技术公司Celera Genomics宣布对人类基因组测序时,人类基因序列还并不真正完整.有大约15%的内容缺 ...
NGS 检测及其应用

NGS 检测:高通量测序技术(High-throughput sequencing)又称"下一代"测序技术("Next-generation" sequenci ...
二代测序方法：DNA测序之靶向重测序

二代测序方法:DNA测序之靶向重测序 - 目录 1. 靶向重测序 2. 靶向测序技术 2.1 多重扩增子测序 2.2 杂交捕获测序 2.3 小结 3. 杂交捕获测序数据质量评估 4. 基于测序的基因分 ...
意料之中，23andMe放弃NGS是为了获取更全面的个人消费级基因数据

23andMe放弃下一代测序技术(NGS)研发,事情多少有点意料之外,俨然给大热的基因检测技术泼了一盆冷水.可是仔细想一想,却又在情理之中,不是太成熟的技术.高昂的测序价格以及消费者低测序意愿和需求, ...
阅尔基因和微软研究院开发深度学习模型，用于预测NGS测序深度

2021 年 7 月 19 日,开发超灵敏测序分析技术的基因组学和分子诊断公司阅尔基因与英国微软研究院在顶级学术期刊<Nature Communications>上公布了一项最新研究成果, ...
Food Res.| 江南大学：单分子实时DNA测序技术和培养方法联合揭示了接种小麦原料曲中的功能微生物

推荐:江舜尧编译:思敏如月编辑:小菌菌江南大学食品科学与技术学院谷物发酵技术国家工程实验室刘双平副教授等人于2020年2月2日在Food Research International期刊发表题为 ...
关闭DNA甲基化如何影响我们基因组中的“暗物质”

在构成人体的DNA的分子中,只有一小部分(约3%)是由基因.基本的构建基块或我们的身体组成的,其余的被认为是暗物质,因为它似乎没有什么生物学意义.在这个区域之外,最重要的是由科学家称之为转座子或转座子 ...
理想中的DNA测序

理想中的DNA测序
脑脊液中检测到EB病毒DNA，意义何在？

作者 / 范思远关鸿志目前,脑脊液宏基因组二代测序(mNGS)技术已经应用于神经感染性疾病的病原学诊断,检测结果中时常能够看到EB病毒的"身影".这里,我们探讨一下病毒核酸检测 ...
7-跟着science学习宏基因组-从宏基因组中提取16S/18S序列分析2-组装注释

[TOC] 写在前面这是对宏基因组提取扩增子序列16S分析的第二部分,这部分将核糖体RNA基因组装后进行分析.上一节我们使用了 bbmap提取了核糖体序列,但是单纯用于ASV的方法聚类是不行的,以为 ...
人体中98.5%的“垃圾DNA”到底有什么用？

本文系生物谷原创编译! 生物学家们在很长一段时间里都认为,既然几乎所有具体的生理机能都要由蛋白质来完成,那么不编码蛋白质的DNA应该是没有用的,可以称为"垃圾DNA":而且人类基因 ...
菜鸟入门：DNA测序结果图如何看？

作为一枚临床上大夫,通常看到的基因检测报告是长下面这样的,你基本不会关心他是咋么来的?咋么没的一般很简单(病人搞丢了). 但是实验狗就真的没有辣么好的运气了,你需要刨他们的祖坟,你甚至会疑惑一代测序和 ...
8-跟着science学习宏基因组-从宏基因组中提取16S序列分析3-barrnap提取核酸序列-组装注释

全部样本全部样本混合拼装 mkdir ./assemblyall/ megahit --continue --out-dir ./assemblyall/megahit/ -m 0.9 -t 6 - ...
如果你的生命中也有未完结的创伤事件，不妨试试那把神奇的“空椅子”

本文阅读提示: 1.心理工作坊上的启示 2."空椅子"理论 3.空椅子治疗经历 4.什么是未完结事件 01 前言我总想,未来,人类面对的棘手问题里,一定会包括情绪问题,因为在漫长 ...

基因组中是否存在未被DNA测序覆盖的区域（学徒翻译）

重复DNA序列

G/C偏差

碎片偏差

总结

相关推荐