做免疫浸润,TIMER数据库真心好用!
做肿瘤组织中免疫细胞的浸润评估有 CIBERSORT, quanTIseq, xCell, MCP-counter等算法。这些大多需要自己下载代码来进行分析。但是有一个人美心善的算法作者,把TCGA所有癌症的RNA-seq的基于不同算法的结果都进行了运算,同时也把结果放到了网站上。
来源:https://www.dfhcc.harvard.edu/insider/member-detail/member/xiaole-shirley-liu-phd/
这个人就是来自中国的生物信息领域科学家刘小乐,目前供职于美国哈佛大学及Dana-Farber癌症研究所教授实验室,这个开发的神奇网站叫TIMER(Tumor Immune Estimation Resource)。
网址:https://cistrome.shinyapps.io/timer
TIMER是利用RNA-Seq表达谱数据检测肿瘤组织中免疫细胞的浸润情况。相较于TCIA展示了20种免疫细胞浸润比例,TIMER则提供6种免疫细胞(B cells, CD4+ T cells, CD8+ T cells, Neutrphils, Macrophages and Dendritic cells )的浸润情况。
IMER网站分7个模块,其中前面6个模块为展示TCGA数据的展示和一些分析,最后一个模块则提供免疫细胞浸润比例的量化分析。接下来按Gene、Survival、Mutation、SCNA、DiffExp、Correlation、Estimation顺序一一介绍。
01
Gene
Gene模块展示基因表达和免疫浸润比例之间的关系。基因模块允许用户选择任何感兴趣的基因,并可视化其表达与多种癌症类型中免疫浸润水平的相关性。
在运算时,需要输入官方基因符号和至少一种癌症类型。在成功提交输入后,将生成并显示散点图,显示纯度校正的部分Spearman的rho值和统计显著性。抗肿瘤纯度的基因表达水平始终显示在最左侧的面板上。因为预期在微环境中高度表达的基因与肿瘤纯度具有负相关性,而预期在肿瘤细胞中高度表达的基因则相反。由于GBM / OV的微阵列数据比RNA-seq数据包含更多的样本,因此如果基因可用,将用GBM / OV的微阵列表达值进行计算。
02
Survival
Survival模块可以展示临床结局和免疫细胞浸润和基因表达之间的关系。值得一提的是这个选择功能,可以灵活地校正多变量Cox比例风险模型中的多个协变量。协变量包括临床因素(年龄,性别,种族,肿瘤分期)和基因表达,这样就可以做个三年或五年的生存分析。
同时Survival模块允许用户探索一个或多个肿瘤免疫亚群的临床相关性,定义所有输入后,TIMER会自动输出Cox回归结果,包括危险比和统计显著性。TIMER还绘制了Kaplan-Meier图以显示免疫浸润和基因,以可视化生存差异。用户定义的滑块将级别分为低级别和高级别。在每个图中显示了用于比较两组生存曲线的对数秩检验的P值。
03
Mutation
Mutation模块展示基因突变与免疫浸润之间的相关性,检验基因突变是否影响免疫细胞的浸润比例。在每种癌症类型中,系统选择“前50位基因或10%的非同义突变频率最高”作为“基因突变”字段中的选项。生成每个免疫亚组的箱形图,以比较不同基因突变状态下免疫渗透水平的分布,并使用双向Wilcoxon秩和检验估算统计学显着性。
04
SCNA
SCNA模块可比较给定基因具有不同体细胞拷贝数变化的肿瘤之间的肿瘤浸润关系。SCNA由GISTIC 2.0定义 ,检验与正常组织相比基因不同拷贝状态对免疫浸润的影响包括深度删除(-2),臂级删除(-1),二倍体/正常(0),臂级增益(1)和高扩增(2)。提出箱形图以显示在所选癌症类型中每个拷贝数状态下每个免疫亚组的分布。使用双向Wilcoxon秩和检验将每个SCNA类别的渗透水平与正常水平进行比较。
05
Diff Exp
DiffExp模块可以让用户研究所有TCGA肿瘤中感兴趣的任何基因在肿瘤与邻近正常组织之间的差异表达。基因表达水平的分布用箱形图显示,差异表达的统计学显着性用Wilcoxon检验评估。得出的图会展示基因在多癌种的肿瘤和正常组织的差异表达,其中差异显著的肿瘤则会有灰色的背景。
06
Correlation
Correlation模块主要展示基因的共表达关系,绘制给定癌症类型中一对用户定义的基因之间的表达散点图,以及Spearman的rho值和估计的统计显着性。还提供了以肿瘤纯度或年龄为条件的部分相关性选项。右上角和左下角的图表示肿瘤纯度(或年龄)与基因表达的关系,右下角则表示两个基因间的共表达关系。
07
Estimation
最后一个模块是Estimation,这部分可以将用户自己的数据进行免疫浸润的分析。用户界面相当简单,只有3个参数,一个是导入的文件,一个是数据的分隔符,默认为制表符tab分隔,还有一个是相关的肿瘤类型。
值得注意的是,TIMER只提供TCGA里已有的癌种数据进行分析。