fast5和fastq格式
前面我们介绍了Oxford Nanopore Technologies(牛津纳米孔技术)公司的一些测序仪,也看到了它产出的测序数据,详见:全长转录组分析之牛津纳米孔测序介绍
fast5:原始电信号文件,以.fast5为文件结尾。此文件既有测序得到的序列信息,还有甲基化修饰信息。经过basecall,MinKNOW2.2软件包中的Guppy软件可以将fast5文件转换得到fq文件。测序仪本身是带有这个basecall功能的。 fastq:由fast5文件转换而来,以.fastq或.fq结尾,与二代格式一样,四行为一个单位,只不过序列要长很多,这是三代的一个优势。
final_summary.txt文件:
sequencing_summary.txt文件:主要存储了一些read长度,每个read的平均测序质量(MeanQscore)等信息,作为对数据进行长度,N50,MeanLength,MaxLenght等指标统计,后续过滤等用途。 sequance_summary
下期将介绍:
数据过滤标准 一般初步会对数据做哪些指标统计 如何评价这个数据质量
赞 (0)