Nanostring的表达矩阵分析也是大同小异

临床样品的特色是:通常是FFPE样本,在保存过程中往往造成RNA的断裂,不论是qPCR还是RNA-seq都难以进行精准的定量,这个时候Nanostring 仪器就是为了解决这些问题而诞生的。所以它在医院的流行程度很高,而我们要介绍的这篇文章就来自于医院科研人员,所以选择Nanostring就很容易理解啦。

Nanostring是介于传统的芯片技术和现在的RNA-seq技术之间的一个选择,有点类似于靶向转录组,传统的qPCR实验操作步骤多且繁复,不适合高通量的基因表达实验设计, 而新一代RNA-seq价格昂贵并且需要耗费大量生物信息分析资源,难以在短时间内读取有效数据。NanoString技术原理是基于核酸分子与探针杂交后,对探针上的荧光分子条形码进行直接测量。每个条形码标记对应某一特异mRNA序列,在同一样本中最高可以测量800个条形码,而所需的样本量可以低至100ng RNA

而且,基于杂交原理,NanoString的数字化定量技术无需转录,扩增或者文库构建,一方面省去了冗长的实验程序和人力资源,另一方面最大程度地降低了由于酶促反应带来的潜在偏差。对于样本量稀少的临床样本,NanoString技术可以不经过RNA提取,直接在FFPE样本,细胞裂解液乃至全血中直接对RNA进行定量,进一步降低由于提取过程可能带来的潜在偏差。

Nanostring的表达矩阵分析结果描述

如下,可以看到,表达矩阵分析以及结果解读与常规的转录组测序数据类似,都是描述哪些基因上调或者下调。

 

其实就是拿到表达矩阵后走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;

那么我们继续看看该文章对Nanostring的表达矩阵分析结果的可视化吧!

Nanostring的表达矩阵分析结果可视化

首先,研究者别出心裁的把这个火山图旋转了90度,但并不会改变其本质啦!

 

我们的作业就是重复出来这个热图!表达矩阵作者上传到了GEO数据库。

仍然是使用R语言

研究者公布了数据:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE134129

所以,大家可以很方便的下载后自行处理,完成我们的学徒任务,就是绘制上面的火山图!

 

样本是;

GSM3937676    LLC_control_1
GSM3937677    LLC_control_2
GSM3937678    LLC_control_3
GSM3937679    LLC_control_4
GSM3937680    LLC_control_5
GSM3937681    LLC_control_6
GSM3937682    LLC_control_7
GSM3937683    LLC_control_8
GSM3937684    LLC_control_9
GSM3937685    LLC_STING_1
GSM3937686    LLC_STING_2
GSM3937687    LLC_STING_3
GSM3937688    LLC_STING_4
GSM3937689    LLC_STING_5
GSM3937690    LLC_STING_6
GSM3937691    LLC_STING_7
GSM3937692    LLC_STING_8
GSM3937693    LLC_STING KO_1
GSM3937694    LLC_STING KO_2
GSM3937695    LLC_STING KO_3
GSM3937696    LLC_STING KO_4

可以看到是很明显的3个组,表达矩阵也是可以下载的!

image-20191212092220479

下载后如下所示:

image-20191212092306469

其实作者给出的差异分析结果,如下:

image-20191212092330764

不过我还是希望你可以自行读取作者给出的表达矩阵,自己做差异分析,然后跟作者的结果进行比较。

(0)

相关推荐