首先了解一下circRNA背景知识
我前面说到过,如果你确实是第一次接触circRNA芯片数据,完全不用担心, 你只需要把它看作是你不知道基因名字的mRNA芯片,最后得到的各种各样的分析结果,只不过是以circRNA的ID来表示而已。
虽然是一个ID,但是也是需要理解的,这里我们仍然是以 发表在Cancer Cell International,时间是 November 2019 ,标题是 A 3-circular RNA signature as a noninvasive biomarker for diagnosis of colorectal cancer的文章来举例。
首先看两个circRNA基因结果示意图
一般描述:Circular RNAs (circRNA) originate from back-splicing events, which link a downstream 5' splice site to an upstream 3' splice site.
从示意图可以看到,具体的circRNA都是在基因内部的一些外显子连接起来了,就是所谓的环化!而这个基因就是具体的circRNA的host gene啦。
然后看看circRNA的host gene
circRNA虽然只有ID,但是它是有host gene的,这样的话,也就是以host gene作为媒介,从而进行数据库注释啦。
值得注意的是,并不是所有的circRNA都是在基因上面哦。
更丰富的circRNA种类
这个时候,我们看另外一个文献,发表在J Transl Med. 2018 Dec 的:Circular RNA regulatory network reveals cell-cell crosstalk in acute myeloid leukemia extramedullary infiltration.
对circRNA的注释就更丰富了,CircRNA检测的基本原理是去识别反向剪切的位点(backsplice),最主要的circRNA类型是外显子来源的,当然,在内含子、间区、UTR区域、lncRNA区域以及已知转录本的反义链区域也都鉴定到circRNA,同一个位点可能形成多个circRNA,每个circRNA可能包含一个或多个外显子。
那些并不在基因上面的circRNA比例并不多哦,它们就没有host gene
circRNA形成的3种方式
circRNA产生方式包括外显子环化和内含子环化。
参考DOI: 10.13213/j.cnki.jeom.2017.17415
circRNA的3大功能
circRNA 具有稳定并且广泛的 表达,在特定类型的细胞或组织中有特异性表达。circRNA主要有3个功能,包括
充当miRNA“海绵”
调节转录和剪接
与RNA结合蛋白相互作用
参考DOI: 10.13213/j.cnki.jeom.2017.17415
circRNA的这些功能决定着如何使用它进行科研课题设计。
收集整理好的circRNA相关数据库
Circbase (http://cirbase.org/)
这个数据库收集了几千条在真核细胞表达的 circRNAs,是个公共 circRNA 数据集, 有相应 circRNA 详细信息,还可以下载 circRNA 序列。CIRCpedia v2 http://www.picb.ac.cn/rnomics/circpedia/)
CIRCpedia v2 是一个更新的综合数据库,包含来自 6 个不同物种的 180 多个 RNA-seq 数据集共 262782 条的 circRNA 注释。该数据库允许用户搜索、浏览和下载具有各种细胞类型/组织(包括疾病样本)表达特征的环状 rna。
此外,更新后的数据库包含了人类和小鼠之间环状 rna 的保守性分析。
3.Circular RNA Interactome (http://circinteractome.nia.nih.gov/Circular_RNA/circular rna.html)
该数据库预测了已知的 109 个 RNA 结合蛋白数据集与 circbase 中的 circRNA 的结合位点,并利用 Targetscan 软件预测了 miRNAs 与 circRNA 的潜在结合位点。此外, 该数据库还可以用于设计环状 RNA 引物, 针对环状 RNA 的 siRNA。circRNADb (http://202.195.183.4:8000/circrnadb/circRNADb.php)
首个汇总编码蛋白环状 RNA 的数据库, 共收录了 32,914 个带注释的人类外显子 circRNA, 是一个完整的人类环状 RNA 分子数据库, 每条记录包含详细的基因组信息、 RNA 编辑情况、 IRES 序列元件、 预测的 ORF 等信息, 可以作为大规模研究人类 circRNA 的宝贵资源。
可以根据基因名、细胞类型、pubmedID和蛋白编码能力浏览:
这里展示的是有蛋白编码证据的circRNA:TSCD (tissue-specific circRNA database) ( http://gb.whu.edu.cn/TSCD)
此数据库是一个系统分析组织特异性环状 RNA 数据库。包含人和小鼠 2 个物种, 16 种组织的特异性环状RNA。
比如心脏特异性表达的circRNA:
及预测结合的miRNA:MiOncoCirc (https://mioncocirc.github.io/)
由密歇根大学开发的由癌症临床样本汇编的环状 rna 数据库。在这个数据库里面可以查询到某个 circRNA 在不同癌症临床样本的表达情况:
7.CSCD(cancer-specific circRNA database) ( http://gb.whu.edu.cn/CSCD/)
这个数据库是由武大何春江教授发布一个全新的肿瘤特异性 circRNA 数据库。
根据肿瘤细胞查找circRNA:exoRBase(http://www.exoRBase.org)
这个外泌体环状 RNA 数据库是由复旦黄胜林教授开发的。exoRBase 数据库共收录了 58330 种 circRNAs, 15501 种 lncRNAs, 18333 种 mRNAs,它们来自 92 份血清外泌体 RNA-seq 测序样本。作者还依据GTEx project 获得组织特异性 RNA 表达特征,分析了相关 RNA分子的组织来源。circRNADisease http://cgga.org.cn:9091/circRNADisease/ 这个数据库是由武大何春江教授发布一个全新的肿瘤特异性 circRNA 数据库。
exoRBase(http://www.exoRBase.org)
这个外泌体环状 RNA 数据库是由复旦黄胜林教授开发的。exoRBase 数据库共收录了 58330 种 circRNAs, 15501 种 lncRNAs, 18333 种 mRNAs,它们来自 92 份血清外泌体 RNA-seq 测序样本。作者还依据GTEx project 获得组织特异性 RNA 表达特征,分析了相关 RNA分子的组织来源。circRNADisease http://cgga.org.cn:9091/circRNADisease/