卫生部干部的2017年全国肿瘤体细胞基因突变NGS评价数据
找变异流程
找变异简单点说,就是把高通量测序得到的成千上万条序列片段比对到合适的参考基因组,找到那些成功比对的片段与参考基因组的微小差异情况。 那么就涉及到存储测序数据的fastq数据格式,比对的工具,比对后的sam格式,找微小差异的工具,差异结果的vcf文件,每个步骤的软件选择,参数调整。当然,最重要的是走通整个流程,明白自己在做什么。

测试数据
临检中心开通了2种数据传输方式(百度云盘和FTP客户端),希望各单位选择合适的下载方式,分流下载:
1,FTP客户端:
地址:211.103.138.229 端口是21
账号:NCCLBIPT
密码:nccl123456
在你的linux服务器的终端里面登录个ftp,然后用mget命令下载即可。
2,百度云盘:
链接 : http://pan.baidu.com/s/1miMfpag
密码 : rfmn
这么大的数据,如果用百度云客户端下载,要么选择百度会员服务,要么用破解限速版本。
学习步骤
step1 : 计算机配置(或者云服务器)
step2:软件安装,了解命令行,终端
step3:了解ngs,fastq,测序数据相关
step4:了解比对,使用几个比对工具
step5:了解sam文件的高级操作,统计可视化
step6:了解找变异,使用几个工具
step7:了解vcf格式,一些已有变异资源
step8: 了解变异分类形式,简单的注释到基因
赞 (0)
