威斯康星大学DNA测序重点实验室Molly Zeller分享:如何为应用研究选择合适的DNA-Seq...
“作为一个重点实验室,我们需要保证较短的DNA测序运转周期,正是Celero™ EZ DNA-Seq文库制备试剂盒满足了这一需求。”威斯康星大学麦迪逊生物技术中心(UWBC)DNA测序重点实验室经理Molly Zeller表示。
Molly Zeller所在的威斯康辛大学麦迪逊生物技术中心(UWBC)DNA测序重点实验室拥有丰富的构建二代测序(NGS)文库制备经验。据介绍,该实验室可以处理各种类型和种类的样品,包括来自世界各地的人类、老鼠、微生物、真菌等样品,需要大量的文库制备。该实验室意识到此前使用的文库制备试剂盒费力且昂贵,并且结果均一性不够理想。因此研究人员开始寻找一种能够提供快速、预算友好和统一工作流程的试剂盒,来解决上述问题。
此前,UWBC实验室使用的试剂盒采用机械打断,步骤繁琐,且经常产生带有接头二聚体的文库。这类机械打断——使用超声波法或声波剪切——操作耗时,而且往往需要使用昂贵的专用设备。因此,实验室团队选择试剂盒的第一个标准是使用酶切打断,排除了任何需要机械打断的试剂盒。
另一方面,该实验室此前使用的试剂盒大多需要在每一步酶反应后进行磁珠纯化,不仅延长了实验流程,而且增加了样本损失的可能。该团队选择试剂盒的第二个标准就是在保证文库质量的前提下,使用较少纯化步骤的试剂盒。
此外,运营成本是重点实验室保证竞争力需考虑的基本因素,包括员工、耗材和试剂等成本。当试剂盒的使用需要大量的人工投入时,人工成本在总成本中会占很大比例。该实验室旨在为自己和客户的预算降低成本。因此,选择试剂盒的第三个标准是有效缩短操作时间,确保每个样品的成本更低,将节省的成本回馈客户。
最后,选择文库制备试剂盒的一项关键指标就是其生成的数据质量具有较高的一致性。优质文库的标志是平滑的“钟形曲线”(正态分布),没有接头二聚体的峰值。而该实验室此前使用的试剂盒还需要额外的接头二聚体纯化步骤,增加实验操作时间,并可能导致样品的损失。常用的接头滴定法,只对实验室相对单一物种来源的样本有效,不适用于来自不同来源的gDNA。因此,最小化终文库的接头二聚体也是需要考虑的一个重要标准。
基于上述选择标准,UWBC实验室最终选择了Celero EZ DNA-seq建库试剂盒用于其基因组DNA文库制备实验流程,下面Molly Zeller将为大家阐述为什么选择该款试剂盒以及该试剂盒的建库表现。
实验流程对比
目前市面上有很多DNA文库制备试剂盒可以选择,UWBC依据设定的标准选择了部分试剂盒进行比较,其实验流程如下:
该团队选择了基础研究中被广泛使用的NA12878 gDNA作为参考样本。如表1所示,每个试剂盒都可以处理广泛的gDNA输入量。基于客户常用的文库制备输入量,团队选择了50ng用于测试比较。根据不同试剂盒对应的实验手册展开实验。制备好的文库同时进行质控,并对通过质控的文库进行测序。
将文库稀释到2 nM后,等量混样,在Illumina NovaSeq 6000测序平台上进行测序。所有文库的测序都采用了UWBC实验室新的测序方法,使用S2 flow cell 2x150,每个文库的测序reads数为100M。数据处理采用bcl2fastq v2.20.0.422和FastQC v0.11.6。
建库性能分析对比
每个样本测得的reads数如表2所示,并提供了每个样本的Q30 (每个碱基的正确率为99.9%)。其中,Celero EZ DNA-Seq,QIAseq FX和Nextera XT试剂盒全部高于90%。
插入长度、重复率和碱基百分比含量都是确定测序质量的重要指标。插入长度是指匹配到参考基因组上分析的片段长度,也是片段筛选期间被保留下来的DNA片段。使用TapeStation(安捷伦)检测的插入片段在不同试剂盒之间是一致的。
图1.Agilent Tapestation曲线-文库在Agilent Tapestation上跑胶以观察片段大小。这是为了确保没有接头二聚体存在的情况下,计算摩尔浓度,以确定文库的质量。
表2.文库测序参数 (Illumina NovaSeq 6000,PE 2x150,S2 flow cell)
图2.接头剪切后的插入片段的分布——剪切序列中的接头二聚体,并绘制保留片段的分布情况,以呈现真正的插入片段大小。
UWBC团队还分析了去重后保留的序列百分比,以确定每个样本的多样性。保留序列的占比越高,扩增过程中产生的重复越少。由于每个试剂盒的样品输入量相同,该指标可用于直接比较PCR的重复率。根据表2中的数据,Celero EZ DNA- seq、QIASeq FX和TruSeq DNA Nano试剂盒去重后的保留序列百分比最高。
最后,UWBC团队比较了所有碱基的百分比和fastq文件中GC含量占比。此前使用的文库制备试剂盒在片段末端表现出很小的偏差,如图3所示。TruSeq DNA Nano文库制备导致了第八碱基出现偏差,表明机械打断不会优先剪切DNA的特定识别位点或碱基对。QIAseq和Celero EZ DNA-Seq文库的序列内容显示,前10-12个碱基位置存在一定的偏差,这与酶切文库制备流程的预期一致。
试剂盒对基因组的覆盖率取决于样本中的GC含量。因为使用的材料是相同的,所以该研究中的所有文库都应该有相同的GC含量分布,任何变化都表明可能污染。图4显示了大多数文库制备的GC分布达到了预期。
图4.每条read的GC含量(%)。检查文库的GC含量以观察测序数据中的GC或AT含量可能存在任何潜在的偏差。结果显示了所有序列上的碱基含量的理论分布(蓝线)和实际分布(红线)。Y轴为read数,X轴是每条read的GC%。
试剂盒的选择
最终,UWBC团队基于选择标准、实验室研究需求和上述分析数据选择了预算友好、快速、均一性好且使用酶切片段化的文库制备试剂盒Celero EZ DNA-Seq,并同时考虑了工作流程的方便性、UDI的可获得性和测序数据的质量。
UWBC团队认为,Celero EZ DNA-Seq的实验流程快速且简单,有三个Pre-PCR步骤和两个Post-PCR步骤,可以在一天内轻松完成。该实验流程很容易实现自动化,UWBC团队计划在移液工作站中使用该试剂盒,以减少手动操作时间。
除了比较试剂成本,还要比较人工和耗材的成本。UWBC团队认为,Celero EZ DNA-Seq工作流程的速度为实验室节省了人工成本。DimerFree接头连接技术还使文库准备工作更进一步,无需担忧接头二聚体等问题。该技术对UWBC来说是一个巨大的优势,因为在此之前,不同的物种、样品类型和项目都需要接头浓度滴定和优化,以避免接头二聚体的形成。同时,为了评估均一性,该团队在Illumina NovaSeq上对文库进行测序,需要特异性双端index(UDIs)。Celero EZ DNA-Seq可提供384个UDI,有助于避免测序瓶颈。
测序完成后,还要关注插入片段的大小。UWBC团队在Illumina NovaSeq上的测序读长为2x150bp,并希望插入片段在不测接头序列的情况下能够重叠。与UWBC实验室常用的试剂盒相比,虽然标准的Celero EZ DNA-Seq实验流程并没有生成相同长度范围的插入片段,但通过对酶切时间和/或片段筛选进行一些优化将生成期望范围内的片段。同时,研究对比的其他测序数据,包括多样性、序列占比和偏差,都偏向于选择Celero EZ DNA-Seq作为文库制备试剂盒。虽然从该试剂盒观察到一些测序偏差——和酶切打断的预期一样——但可以通过进一步优化整个样本的片段化程度,以提供覆盖整个基因组的信息。
此外,该团队还比较了Celero EZ DNA-Seq的整个外显子组捕获,结果显示其适用于评估中使用的所有捕获技术。
UWBC团队表示,未来将对Celero EZ DNA-Seq实验流程例如自动化等,使用不同物种和不同类型的样本进行评估。
关于作者
莫莉·泽勒(Molly Zeller)目前共同管理着威斯康星大学麦迪逊生物技术中心的DNA测序重点实验室。她在科罗拉多州立大学(Colorado State University)获得细胞和分子生物学硕士学位后,在那里工作了四年。Molly主要从事全基因组短读长测序、基因分型测序(GBS)、长序列全基因组和扩增子测序的基因组DNA文库制备工作。
· END ·