使用单分子标签的RNA-Seq会最小化序列偏好和扩增噪音
研究内容
这项工作讨论了如何最小化PCR扩增偏好性(就是Duplication)对测序数据,特别是低拷贝序列,定量分析的干扰。研究团队开发出了一种称为Digital RNA sequencing的方法:序列在反转录后,加入大量的标签(barcode),几乎每个cDNA都被唯一的barcode标记,然后进行PCR扩增获得转录组测序文库(见下图)。由于序列是被barcode唯一标记的,计算序列拷贝数时,不再直接统计同一种reads的数量,而是统计每种reads有多少个unique的barcode。而具有相同barcode的同一种reads,无论有多少拷贝数,都只计作一个拷贝,即来自PCR扩增的假重复(Duplication)被有效去除。
可以简单地认为,在样本中cDNA1有3个拷贝,cDNA2有2个拷贝,比例为3:2,然后用大量不同的barcode标记这5条序列,每条序列都被unique的barcode标记,最后进行PCR扩增完成文库制备。由于Duplication的存在,在没有barcode标记的情况下,cDNA1经扩增变成了9个拷贝,cDNA2变成了12个拷贝,比例变成了3:4,而两者原始的比例是3:2;而标记了barcode的cDNA1和cDNA2,合并具有相同barcode的同种序列后,cDNA1和cDNA2仍保持原始的拷贝数和比例,此种方案下测序定量结果准确反映了样本中序列的真实丰度和比例。
图 标签标记序列法去除Duplication的原理
参考文献
Shiroguchi K, et al. Digital RNA sequencing minimizes sequence-dependent bias and amplification noise with optimized single-molecule barcodes. Proc Natl Acad Sci U S A. 2012 Jan 24;109(4):1347-52.