甲基化
甲基化思路
课前的话
👍
1.本次课程是甲基化专题,出发点是联合甲基化和转录组进行生信分析,课程可能会讲到很多大家都没怎么听说过了解过包,但是在甲基化相关分析中很实用
2.课程的设计是针对小白零基础,所以前几天可能会有很多常识性内容,会的小伙伴前面稍微耐心一些,后面会有些不一样的内容
3.咱们上课按照课程大纲走,边走边看,如果有跟不上的情况,到时候我们再调整课程进度,另外如果有特别想学习的甲基化相关分析技能,可以跟我提,我觉得合适的也会作为了课程的一部分
4.大家可以根据自己的兴趣爱好进行分组找队友,在腾讯文档里面没有写的,你可以当队长,相当于发布英雄贴,在上课期间有同学跟你一组,那你们在课程中就可以一起学习讨论,甚至设计文章思路,答疑的时候就可以开始分析了。我建议每个组的人数不要超过5个人,太多人了导致低效率划水以及名字不好带(说话有点直接哈)
5.大家先不加我私聊,上课期间私聊我很费精力,这期间我的主要精力就是在群里,不希望被分散,有问题就先发群里,我会回答的。等上完课,大家如果有思路或者文章方面的问题,可以私聊我。
6.关于同学们自己研究的疾病本身的病理机制和观点等,可能我还没有你们了解深刻,但是对于怎么结合生信分析,如何进一步分析,可以一起交流探讨
一、甲基化芯片背景知识
1.甲基化的生物学意义,
概念
📌
概念:甲基化是在甲基转移酶的催化下胞嘧啶(C)第五个碳原子添加一个甲基基团形成,通常DNA甲基化发生在CpG位点,但非CpG位点同样发生甲基化。甲基化水平可以分为高甲基化、低甲基化和去甲基化。由于甲基化是疏水基团,DNA高甲基化能够影响DNA结构,从而影响基因的转录。
功能
(1)基因表达调控 在启动子区域的胞嘧啶甲基化通常能够降低基因表达。88%的活跃的启动子通常是去甲基化的。(羟甲基化与基因表达升高相关)
(2)染色质的结构 高甲基化能够导致异染色质形成。如果异染色质中的高甲基化位点出现异常的低甲基化,则与染色体不稳定相关。比如选择行X染色体的失活。
(3)细胞分化 甲基化水平改变通常能够导致细胞向一个方向进行分化,所以分化后的细胞通常不能再逆转为干细胞。
(4)疾病的发生 咱们上述的三种方式都能够导致对吧
📌
CpG岛:具有超过55%的GC含量,长度大于500bp的片段。40%的启动子区域都包含CpG岛,简单来说就是CpG位点很多的片段
C是胞嘧啶,G鸟嘌呤,p是磷酸基团,CpG岛就是CpG含量比较高的片段
📌
CpG island 是很多有CpG位点的核苷酸
📌
CpG shore:距离CpG岛2kb区间内的片段。超过75%的组织特异性甲基化区间都在shore部位,shore区间的甲基化与基因表达具有强相关性。
📌
增强子:是一段能够促进远端的靶基因转录的作用元件,通常由甲基化调控,有研究表明增强子能够整合转录因子结合的平台。我们之后有相关的分析工具进行这方面调控关系的探索,比如ELMER
📌
启动子:与RNA聚合酶结合并能启动mRNA合成的序列。我们生信分析时,一般选择上游2 kb,但也有选择上下游2kb的。获取启动子序列时要注意转录方向(正链或负链)
2.目前甲基化芯片或测序的对比
WGBS-Seq:
原理是用亚硫酸盐处理DNA序列,首先将基因组中未发生甲基化的 C 碱基转换成 U(T),从而与原本具有甲基化修饰的碱基C区分开来,然后进行PCR扩增,再结合高通量测序技术,适用于全基因组范围内绘制单碱基分辨率的DNA 甲基化图谱,适用于所有物种,能够检测所有基因以及人类中包含3800万个CpGs位点(目前能检测的范围最广)。但是价格昂贵,目前应用也很少。
RRBS-Seq
(Reduced Representation Bisulfite Sequencing) 限制性内切酶对基因组DNA序列进行酶切,然后富集启动子及CpG岛区域,接着再进行亚硫酸盐进行转化,从而用较小的数据量就可得到包含最多CpG位点的单碱基水平的甲基化图谱。检测深度只包含50%的promoters,但是价格和methylation microarray差不多,所以应用的比较少
MeDIP
(Methylated DNA immunoprecipitation )首先通过5'-甲基胞嘧啶抗体去特异性富集基因组上发生甲基化的DNA片段,接着通过高通量测序在全基因组水平上对CpG密集的高甲基化区域进行研究。这种技术可以发现基因组中高度甲基化的区域,如CpG岛,但不能进行单个碱基水平的分析,能够检测150bp分辨率的甲基化位点
赞 (0)