探索lncRNA表达量的组织特异性

前面我们布置了学徒任务,复现一下DNA甲基化的组织特异性,见:学徒任务-探索DNA甲基化的组织特异性 。同样的,其它分子,肯定也会有组织特异性,比如lncRNA。发表在Comput Math Methods Med. 2019的文章:Portrait of Tissue-Specific Coexpression Networks of Noncoding RNAs (miRNA and lncRNA) and mRNAs in Normal Tissues 就统性探索了lncRNA表达量的组织特异性。

该课题并没有自己产出数据,而是直接使用GTEx数据库。30种组织的英文是:adipose tissue, adrenal gland, bladder, blood, blood vessel, brain, breast, cervix uteri, colon, esophagus, fallopian tube, heart, kidney, liver, lung, muscle, nerve, ovary, pancreas, pituitary, prostate, salivary gland, skin, small intestine, spleen, stomach, testis, thyroid, uterus, and vagina。

你是否也会好奇下面的问题:

  • 同一个人的不同组织器官的基因表达情况是不是也会有显著差异呢?
  • 或者同一个人的同一部位的不同时间段的基因表达差异咋样呢?
  • 基因表达的个体差异和组织器官的差异哪个更大呢?

要回答这些问题, 那么这个公共数据库你一定用得上,就是GTEx,The Genotype-Tissue Expression (GTEx) project,首次被提出来是2013年,上百位科学家联名在Nature Genetics杂志发表的文章首次介绍了“基因型-组织表达工程”,并成立了“基因型-组织表达研究联盟”(Genotype-Tissue Expression Consortium,GTEx)以下简称“GTEx”)。

因为GTEx数据库直接提供RNA-seq的counts矩阵文件下载,从表达矩阵里面可以根据基因名字区分出来:

  • 1368 个miRNAs,
  • 10167 个lncRNAs
  • 30441 个mRNAs

流程图如下:

这个研究的重点是Gini index used to measure tissue specificity,而不仅仅是某个组织的高表达量。以前我们使用gtex数据库找组织特异性表达基因是直接看top表达量基因,在:https://gtexportal.org/home/topExpressedGenePage 可以搜索,比如我搜索大脑的最高表达量基因,发现它的确可以把大脑区域和身体其它区域很容易的分开。

这篇文章写作超级容易,就是一一列举这30个组织的特异性的表达,包括 miRNAs and lncRNAs以及protein coding RNA

其它物种

留给大家搜索了,理论上很多物种也是有各个器官的表达量信息,包括芯片的以及测序的,包括mRNA,lncRNA,miRNA,甲基化,蛋白。

而且,现在不是单细胞水平的研究很流行嘛,理论上这个组织特异性可以进一步细化到细胞类型的特异性。

癌症领域

既然GTEx数据库的30余种组织,可以有特异性的mRNA,lncRNA,miRNA,那么TCGA数据库的不同癌症,理论上也有癌症类型的特异性的mRNA,lncRNA,miRNA。这样的数据挖掘文章肯定不少,感兴趣也可以自行去搜看看,而且也可以细化到单细胞水平。

2016发表在Scientific Reports的文章;Tissue-specific Co-expression of Long Non-coding and Coding RNAs Associated with Breast Cancer

(0)

相关推荐