TCGA

甲基化芯片

450k甲基化芯片可以检测人全基因组近450000个甲基化位点,具有单碱基的分辨率。全面的覆盖了96%的CpG岛,并根据需求加入了CpG岛以外的CpG位点信息,人类干细胞非CpG甲基化位点,正常组织与肿瘤(多种癌症)组织差异甲基化位点,编码区以外的CpG岛,miRNA启动子区域和GWAS疾病相关区域的位点,同时覆盖270的90%的位点。

CpG位点(英语:CpG sites,或称为CG位点),我理解的cg****就是cg位点
是指DNA的某个区域,其上的碱基序列以胞嘧啶接着鸟嘌呤出现。“CpG”是“—C—磷酸—G—”的缩写 ,指磷酸二酯键连接了胞嘧啶和鸟嘌呤,其中C位于5'端而G位于3'端。

在CpG位点中的胞嘧啶可以被甲基化5-甲基胞嘧啶。在哺乳动物中,基因内CpG位点的甲基化会改变此基因的表达,对这一表达调控的研究是表观遗传学的重要组成部分。涉及添加甲基基团的称为DNA甲基转移酶

在哺乳动物中,70%到80%的CpG位点的胞嘧啶是甲基化的

未甲基化的CpG位点可以被免疫系统的浆细胞样树突状细胞单核细胞NK细胞B细胞上的TLR9(Toll样受体9)识别,来检测体内的微生物感染。

CpG岛是一个富含CpG位点的区域,但客观精确描述所谓“富含”的定义尚不明确。通常对于CpG岛的正式定义为:一个长度至少为200bp的片段,其GC含量高于50%,且“观察期望比”(observed-to-expexted)高于60%。

注:观察期望比:即CpG位点的观察值(片段实际含有的CpG位点数目)和“期待值”的比值。“期待值”通常有两种算法:(C*G)/LS[4]或((C+G)/2)^2/LS[5]。其中,C、G代表胞嘧啶和鸟嘌呤的数目;LS代表片段长度(length of sequence)。

很多哺乳动物基因组中的CpG岛和基因的起始位点相联系[6]。因此,CpG岛的存在对于基因的预测和解释具有帮助作用。

在哺乳动物基因组中,CpG岛的序列长度通常为300-3000bp,在约40%的基因的启动子附近都有发现[7]。在人基因组中则有约70%的基因启动子有高CpG含量。如前文提及,CpG位点的实际存在率比随机概率的结果要低得多[5]

2002年的某研究阐述了CpG岛的预测规则,使用这种规则可以排除一些高GC含量的基因组序列,如Alu重复序列。基于对人21和22号染色体的完全测序研究成果,长度大于500bp、GC含量高于55%、CpG位点“观察期望比”高于65%的DNA序列更有可能是“真正的”CpG岛[8]

CpG岛以至少达到60%的理论CpG位点含量(可达到4-6%)为特征,而基因组中平均CpG含量只有约1%(CG抑制)。和在基因编码区中的CpG位点不同,在基因正常表达时,位于基因启动子区中的CpG位点往往不会被甲基化;这种现象表明启动子序列中的CpG位点的甲基化很可能导致基因表达被抑制。DNA甲基化和组蛋白修饰是基因铭印的核心过程[9]。大多数组织间或正常样本和癌症样本间的甲基化差异发生在CpG岛附近(CpG island shores)而非CpG岛内部[10]

image

一种CpG岛形成的假说图解:通过未被甲基化,从而在漫长的进化史上保留下来

在脊椎动物中,CpG岛往往位于基因转录起始位点附近,尤其是持家基因。CpG位点有被甲基化的倾向,借助这种甲基化可以分辨新合成的DNA链和母链,这在DNA序列复制后的最终校对环节起重要作用。甲基化的胞嘧啶容易脱氨转变成胸腺嘧啶,导致T/G错误配对。胸腺嘧啶DNA糖苷酶(TDG)是人类用于修复TG错配的酶。但由于CpG位点的稀少性,TDG在理论上没有足够高的效率来消除这些快速发生的突变。通常认为CpG岛存在的原因是因受如下选择压力导致的:需要相对更高的CpG含量、更低的甲基化水平或是调控基因需要。最近也有研究称大多数的CpG岛是由非选择压力形成的[11]

(0)

相关推荐

  • 全基因DNA甲基化检测“金标准”--- 改进版简化基因组甲基化测序

    亚硫酸盐转化被誉为DNA甲基化(5mC)检测的"金标准",非甲基化胞嘧啶C在亚硫酸盐转化过程中转变为尿嘧啶U,进而通过PCR扩增转变为胸腺嘧啶T,甲基化mC维持不变,通过高通量测序 ...

  • 表观遗传学(Epigenetics)

    表观遗传学的概念基于遗传学而来,不是单纯的体外在环境导致的甲基化和乙酰基化改变,也不是简单转录因子和miRNA等等基因调控,它的指的是由非DNA变异而改变表型的'可遗传的'现象.现在众多所谓的表观遗传 ...

  • 什么是DNA甲基化?

    近几年DNA甲基化经常被人提及,但很多人对它并不是很了解,那么到底什么是DNA甲基化,它又有什么作用呢,请看敬善基因为您介绍! DNA 化学修饰为 DNA 序列编码基因的表达增加了一层调控机制.这些化 ...

  • 基因甲基化研究实验技术服务

    DNA甲基化主要形成5-甲基胞嘧啶(5-mC)和少量的N6-甲基腺嘌呤(N6-mA)及7-甲基鸟嘌呤(7-mG).DNA的甲基化可引起基因的失活,可引起染色质结构.DNA构象.DNA稳定性及DNA与蛋 ...

  • 学一学DNA甲基化芯片分析流程

    今天是生信星球陪你的第778天 大神一句话,菜鸟跑半年.我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新手 ...

  • Cell:下一代基因编辑技术CRISPRoff,开启表观遗传编辑时代

    以CRISPR/Cas9系统为代表的基因组编辑工具在发挥功能时需要改变DNA序列,往往面临着脱靶导致的安全性问题.   越来越多的研究证明,在病毒感染和癌症中,表观基因组发挥着核心作用.表观遗传通过D ...

  • 文献解读丨甲基化生信分析新思路发5分文章

    专注生物分析最前沿 定期解读生信文章 提供生信分析思路和套路 方便大家短平快发SCI 关于甲基化方面的探索,传统的方法无非是现在公共数据库中下载数据,差异分析构建模型,外部数据验证或者与靶基因相关性分 ...

  • TCGA临床信息中英文对照

    物业名称Property name描述Description种类kind资源类型.The resource type.等份[]aliquots[]从该参与者处提取的等分条形码的列表.List of b ...

  • 基于TCGA数据库肿瘤免疫细胞浸润分析流程

    分析基本思路: 1.首先我们应该要知道什么是肿瘤的免疫细胞浸润模式,通过一些什么样的原理,可以用什么样的软件进行分析. 肿瘤免疫细胞浸润是指免疫细胞从血液中移向肿瘤组织,开始发挥它的作用,可以从肿瘤组 ...

  • 癌症类型和样本代号详解TCGA

    这是实战TCGA数据库的又一个知识点,如果你已经对TCGA有浅显的认识,那么我们应该根据研究方向找到自己的癌症类型,TCGA有一台完整的癌症分型,慢慢这个分型也成为了主流,你别不服气,如果我们有这样的 ...

  • TCGA+biomarker

    引用:Clariom;  https://www.jianshu.com/p/8b257d1ff818生存分析KM法与Cox法异同KM 方法即Kaplan-Meier survival estimat ...

  • 整理从TCGA下载的数据

    如果从TCGA官网网页下载数据,或者使用gdc-client工具下载的数据,都是以单个的文件夹形式存储,并且文件夹中的为压缩文件,所以,下载数据后,第一步就是如何把这些文件复制在同一个文件夹中,以利于 ...

  • 生信分析零基础——从GEO到TCGA,让你从「门外汉」到「老司机」

    什么是生信?提起生信,相信大家又爱又恨,得不到的永远在骚动.爱是不用做实验就能发原创研究,好棒啊.恨是看不懂那一大串代码,不会操作. 目前,不做实验发文章的主要有两大类:Meta分析,生信.其中生信文 ...

  • TCGA可变剪切预测数据库

    可变剪切(Alternative splicing,AS)是基因转录时,通过组合不同的外显子,形成不同转录本的过程,在生命的信息传递过程中发挥着重要的作用,维持蛋白质多样性的主要机制.在不同组织或者发 ...

  • TCGA / 癌症简称 / 缩写 / TCGA癌症中英文对照

    TCGA数据库中含有的癌症名称,简写和中文名称 Cohort 英文名称 中文名称 ACC Adrenocortical carcinoma 肾上腺皮质癌 BLCA Bladder Urothelial ...

  • TCGA免疫浸润评价数据库

    免疫浸润评估大致过程 对于RNA-seq的数据,之前我们的分析方法只是局限于单个基因之间的整合分析,最多也就是做一下富集这样的聚类分析.前段时间随着肿瘤免疫的热度,也有人试着开始利用RNA-seq这样 ...