目前我们公开分布的直播基因组目录如下
✎✎✎
大家追了很久的直播基因组活动到现在可以大方的宣布告一段落啦。
虽然我们生信技能树公众号创立的缘由是为了直播我的基因组,但是在直播的过程中发现连载阅读量实在是太低,而且公众号内容应该多元化,所以中途把这个栏目打入冷宫了。
在这两年里,生物信息学数据格式可以说是几乎没有变化,在基因组数据分析过程中涉及到的,之前也给大家详细介绍过的的fastq, fasta, sam, bam, gtf, vcf, bed, bw, blat, blast 还是老样子。这也符合基础知识点的规律,一旦定义好就很难修正,因为入行的人都是这样学的,它们是生物信息学基石。
然后说到生物信息学数据处理软件,绝大部分都有了非常大的迭代,这当然指的是功能细节上的。比如说samtools,去除PCR重复的命令完全改变了;另外最令人瞩目的进化要数GATK啦,由之前的教育版免费到现在的完全开源,而且纳入了picard-tools的所有功能,可以说是以一己之力承包了找变异的核心流程。
最后一个不容忽视的进化是遗传变异资源数据。那些已经完结的那些项目,比如千人基因组计划,人类单倍型计划,ExAC, GnomAD 当然不会再更新了,但是一些本来就迭代频繁的数据库,比如OMIN,COSMIC,clinvar等,可以说是在两年间发生了翻天覆地的改变,不仅仅是从数据库收纳条目的数量上来看,也是质的进步。
这也是为什么很多人支持过往数据的重分析,而我两年前的全基因组数据当然也会重新分析,也许会有新的发现哦。
但是微信公众号有一个致命的缺点,就是发出去的推文就如泼出去的水,是收不回来的也无法修改,当年做这个直播基因组活动的时候,我还不会markdown语法。所以他们并没有被同步在其它博客论坛,可以说是被埋没在了公众号里面,毕竟公众号只有一两天的热度。
而且无法修改意味着很多教程可能会过时,所以我现在希望组建一个编委会把直播基因组知识点编辑成书,尽最大的可能解决公众号的推文缺点,而且编辑成书籍的另外一个好处是行文更加严谨,受众更多,书籍的迭代会优于博客或者公众号形式。
现在我已经和出版社联系好了,而直播基因组的大部分内容我已经全部写完,需要是三五个书籍编辑,在我的指点下完善这个书稿。还有可能需要一两个有过出版经验的高手,分享一下自己的经验。
目前我们公开分布的直播基因组目录如下
【直播】我的基因组(七):从整体理解全基因组测序数据的变异位点
【直播】我的基因组(十四):bam文件给按照染色体给分割成小文件
【直播】我的基因组(十六):提取左右端测序数据比对到不同染色体的PE reads
【直播】我的基因组(十七):初步分析一下multiple mapping 的情况
【直播】我的基因组(十八):初步分析PCR duplication的情况
【直播】我的基因组21:为什么我算出的染色体覆盖度与公司差异甚大
【直播】我的基因组24:用GATK对SAM格式的文件进行重排
【直播】我的基因组25:用bcftools来call variation
【直播】我的基因组26:GATK的realign对最后的结果影响到底有多大
【直播】我的基因组28-必须要理解vcf格式记录的变异位点信息
【直播】我的基因组 29:统计1000 genome hom-het ratio
【直播】我的基因组 31:vcf文件标记dbSNP的rsID号
【直播】我的基因组 33:用samstat软件对sam文件做统计
【直播】我的基因组 34:Qualimap对比对好的bam文件进行统计及可视化
【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布
【直播】我的基因组 36:这些可能是somatic突变的位点究竟是什么?
【直播】我的基因组 37:gwas研究结果在我身上得到了验证
【直播】我的基因组 41:按照不同的lane来call variation
【直播】我的基因组 42: 不同lane的variation的比较
【直播】我的基因组 44:比对文件画profile和heatmap图
【直播】我的基因组49:Y染色体的SNV不能用常规流程来找?
【直播】我的基因组50:从测序深度和位点间距来看SNV分布情况
【直播】我的基因组51:画全基因范围内的染色体reads覆盖度图
【直播】我的基因组54:把我的variation跟dbSNP数据库相比较
【直播】我的基因组55:简单的PCA分析千人基因组的人群分布
【直播】我的基因组58:用R包SNPRelate来对我的基因型跟hapmap计划数据比较
【直播】我的基因组63:wegene芯片跟二代测序的简单比较
【直播】我的基因组65:什么性状一定是由单个基因简单决定的?
【直播】我的基因组76:用krona对血液全基因组的菌比例可视化
【直播】我的基因组77:批量计算每个蛋白编码基因的测序深度及覆盖度
【直播】我的基因组78:简单解析一下蛋白编码基因的测序深度及覆盖度
【直播】我的基因组82:如何对maf格式的突变文件统计vaf
从WGS测序得到的VCF文件里面提取位于外显子区域的【直播】我的基因组84
安装snpEFF工具并对VCF文件进行注释【直播】我的基因组85
编委会编辑的要求:
至少有过ngs组学实战经验,不然你根本就看不懂直播我的基因组。
至少平均每天能抽出2到4个小时的时间参与我们的编辑活动,不然可能会严重降低团队工作效率。
文字功底尚可,比如一定的审美,仔细认真。
无其它利益相关,纯粹的分享知识。
还等什么呢?
NOW现在行动!
这是史上第一本半科普半专业性质的生物信息学书籍,我可以保证每个参与的小伙伴都能学到无法估量价值的知识,更重要的是会获得我的友谊。
◆ ◆ ◆ ◆ ◆