你应该知道的人类基因组信息
我们的生物信息学入门系列Live已经分别在2017年6月23日与2017年7月31日,成功举办了2场,截止到目前为止,已经有超过600人次参加,好评率100%,感谢各位老铁,各位朋友的支持与鼓励!我们会继续努力的!
在前2次Live的讨论中,我们对生物信息的入门有了一个比较清楚的认识。也带领大家学习了从1代到3代的测序技术与原理;按步骤完成了RNA-SEQ的数据分析;使用R软件进行了boxplot,heatmap等一系列图的绘制;同时,还尝试着阅读了高水平的文献,进行了相关内容的重复与分析。通过这两次课程,我们对高通量测序技术又有了更深层次的认识。
在2次课程中,我们多次提到,高通量测序技术(Next Generation Sequencing, NGS)的相关数据一般是从3个类型的数据进行分析。分别是:
使用全基因组测序(Whole Genome Sequencing, WGS)进行点突变(SNP/SNV)与结构变异(CNV)的分析;
使用RNA-Seq从转录本水平进行分析(寻找差异表达基因,GO分析,寻找可变剪切等等);
使用Genome Profiling的技术,如ChIP-Seq,甲基化测序等进行基因组区域状态的分析等等
那么,在前2次课程中,我们主要是集中在转录本水平上进行分析,同时我们发现了一个重要的问题:很多朋友想做基因组和测序相关的内容,但是又苦于不熟悉很多专业的术语和背景知识,导致学习曲线过于陡峭,很多朋友因此早早放弃了高通量测序技术的学习。看到这个问题,并结合我们之前,我们推出本次Live课程,想以人的基因组为例进行相关概念的解释,并进行ChIP-Seq的数据分析,帮助大家更好的理解相关概念,并掌握ChIP-Seq这种非常重要的数据分析流程。
说起人的基因组,有过高中生物知识的朋友都知道,人有23对染色体,分别是22对常染色体和1对性染色体。还应该知道人类基因组计划。但是——
您可能不知道,人类基因组计划过程中有一位以一己之力挑战全球科学家的逆袭事件:
(Venter团队发表的人类基因组计划paper截图,Science,2001)
您可能不知道,我们的染色体的结构和序列非常复杂,其中充满了插入,缺失,异构:
( Peter F.R. Little, Genome Res, 2005)
您可能还不知道,直到现在我们的参考基因组依然有200M base pair的碱基是没有拼装的:
(图中黑色的部分,都是还未完全拼装的部分)
您可能还不知道,我们的染色体并不是序列状态,而是通过复杂的缠绕过程形成复杂的三维结构。而在这个过程中,组蛋白起到了至关重要的作用:
(出处不详,染色体折叠结构)
在我们这次Live中,我们都会给您详细介绍!
同时,在整个生命过程中,各种染色体上的调控元件起到了各种不同的作用,比如promoter,enhancer等等,那么这些区域怎么在染色体上进行划分与定位?
(使用ChIP-Seq数据进行染色体功能区域的划分, Jason Ernst et al., Nature, 2011)
还有,通过本次Live您还可以了解到ENCODE计划:
(Download from ENCODE website)
还会学习ChIP-Seq的标准分析流程:
(Download from ENCODE website)
最后的最后,保证您能画出下面这种好看的生信graph!
还有这种: