文章复现丨雷达图,相关性热图,GSEA,这些高大上的图表,今天我手把手教你零代码凑一篇纯生信文章!

文章信息

要素拆解:
疾病:胰腺癌
表型:预后
数据来源:TCGA GEO
数据解读:
本文共包括9张图,【挑】作者首先锁定TPM家族,在oncomine数据库分析TPM1-TPM4 mRNA表达情况发现TPM4在胰腺癌中异常高表达。于是,通过TCGA数据和HPA免疫组化结果进一步分析验证。并且,作者还利用GEO数据库进一步分析验证TPM4表达情况。没有预后的分析就是耍流氓,所以作者第二部分先做了【靠】OS和DDS预后分析。接下来,作者对TPM4做了进一步探索【圈】和【联】。【圈】做的是对TPM4单基因分析后的DEGs进行GO和KEGG分析;【联】做的是免疫浸润和TPM4相关基因PPI网络。哈哈,基于【挑圈联靠】四步走可以较快的理解文章脉络哟。

复现工具:

仙桃学术
(https://www.xiantao.love/)
oncomin数据库
(https://www.oncomine.org/resource/login.html)
GEPIA
(http://gepia.cancer-pku.cn/)
GEPIA2021
(http://gepia2021.cancer-pku.cn/)
TIMER2.0 
(http://timer.comp-genomics.org/)
TISIDB
(http://cis.hku.hk/TISIDB/index.php)
HPA数据库
(https://www.proteinatlas.org/)
GEO
(https://www.ncbi.nlm.nih.gov/geo/)
Sting
(https://string-db.org/cgi/)
Cytoscape
(软件,官网下载https://cytoscape.org/)
Excel

数据复现

PS:仙桃学术复现部分颜色配置及一些参数我们一般选默认参数,需要个性化调整的童鞋可以通过点点点获得适合自己的图表哟。
Fig.1 TPM4表达水平和在胰腺癌患者中临床病理特征的相关性
复现步骤:
Fig.1a. oncomine数据库中TPM1-4表达情况。我们以TPM4为例。
① 打开oncomin数据库→ 登录 →输入TPM4基因,点击搜索按钮 → TPM4结果就展示出来啦(本图可以直接使用)。细心的同学会发现我们本次获得的数据与作者作图时所获得的数据是不一样的;这也就从另一个方面说明oncomine数据库是不断更新的。
② 但由于oncomine直接获得的图片像素不够高,我们可以通过excel构建与本图一致的格式及颜色。构建表格大家比较熟悉,我们主要讲下取色的问题。取色之前有推荐Snipaste软件,但我发现其实QQ,微信截图均可取色;步骤:进入截图模式 →把鼠标放在需要取色的部位 → 按下字母【c】复制色号(几款截图软件此步骤都一样哟) → 黏贴色号到excel表格。图中箭头所示为色号对应数字。哈哈,小白的福音。
Fig.1b 作者利用ggalluval包展示了TPM4在联合TCGA和GTEx两个数据库后泛癌中表达情况。由于是R包,我们用工具来替代。
方法一:GEPIA
步骤:进入主页 → 搜索框输入【TPM4】 →点击【GoPIA!】→ 结果就出来啦。
方法二:仙桃学术(https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【表达差异(挑)】→【表达差异】→ 【非配对样本|配对样本】两种格式 → 选择【疾病】→ 输入分子【TPM4】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。小贴士:技术员小哥哥很贴心的提供了数据下载链接哟。
Fig.1c  TPM4在胰腺癌中的表达情况(TCGA)
方法一:仙桃学术
https://www.xiantao.love/)    
首先,进入生信工具的分析工具页面 → 【表达差异(挑)】→【表达差异】→ 【非配对样本|配对样本】两种格式 → 选择【疾病】→ 输入分子【TPM4】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
方法二:GEPIA
http://gepia.cancer-pku.cn/)  
步骤:【Expression DIY】→【box plots】→ 搜索框输入【TPM4】 →【Datasets Selection】选择疾病 →【Add】→ 其它参数默认(可通过点点点进行个性化调整)→ 【Plot】→ 结果就出来啦 → 结果下载。
Fig.1d TPM4   T分期表达情况
仙桃学术
https://www.xiantao.love/)    
首先,进入生信工具的分析工具页面 → 【临床意义(靠)】→【临床相关性】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→ T分期分组设置 → 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
Fig.1e TPM4在不同病理分期中的表达情况

方法一:仙桃学术
https://www.xiantao.love/)  
首先,进入生信工具的分析工具页面 → 【临床意义(靠)】→【临床相关性】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→ 病理分期分组设置 → 【小提琴图】→ 【统计分析】里去除无意义对比 → 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
PS: 我们发现各组之间无明显差异,这是因为现有的工具数据库对原始数据处理有一定的差异所示。

方法二:GEPIA
http://gepia.cancer-pku.cn/)  
步骤:【Expression DIY】 →【Pathological Stage Plot】→ (搜索框输入【TPM4】)(默认前一项选择)→【Datasets Selection】选择疾病 →【Add】→ 【Plot Color】(默认为灰色,太丑)→ 其它参数默认(可通过点点点进行个性化调整)→ 【Plot】→ 结果就出来啦 → 结果下载。
Fig.1f  TPM4与临床特征的关系
方法:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【临床意义(靠)】→【基线资料表】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→ 【分类变量】(建议全选)查看每项是否有意义 → 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。小贴士:直接获取基线资料表哟!
Fig.1g 免疫组化显示TPM4在胰腺癌中高表达
方法:HPA数据库
https://www.proteinatlas.org/
我们分三张图展示:搜索框输入【TPM4】→ 点击【Search】→ 点击【TPM4】进入下一个页面 → 【TISSUE|PATHOLOGY】(正常组织|肿瘤组织) → 左侧导航栏选择【胰腺|胰腺癌】→ 任意点击一张图片进入图片预览页面(图中所示为肿瘤)→ 【选择合适的图片在自己的文章中展示】。
Fig.1g 免疫组化显示TPM4在胰腺癌中高表达
方法:HPA数据库
https://www.proteinatlas.org/
我们分三张图展示:搜索框输入【TPM4】→ 点击【Search】→ 点击【TPM4】进入下一个页面 → 【TISSUE|PATHOLOGY】(正常组织|肿瘤组织) → 左侧导航栏选择【胰腺|胰腺癌】→任意点击一张图片进入图片预览页面(图中所示为肿瘤)→ 【选择合适的图片在自己的文章中展示】。
Fig.1 小结:作者首先从TPM4在泛癌及特定癌种胰腺癌中的差异表达情况入手,并进一步确定TPM4在临床组织中有差异(小验证);进而确定选取TPM4。
Fig.2 基于GEO数据库,TPM4异常表达情况。我们以GSE15471为例展示。

方法:GEO官网
https://www.ncbi.nlm.nih.gov/geo/);
excel;
仙桃学术
https://www.xiantao.love/)。

步骤:
① GEO官网搜索栏输入【GSE15471】→下拉并点击【analyze with GEO2R】进入下一页面
② 分组 → GEO2R分析 → 下载差异基因列表,列表内容须包括ID和Gene.symbol两列
③下载表达谱数据     GEO官网搜索栏输入【GSE15471】→下拉到【download family】→ 点击【series matrix file(s)】
④ 打开差异分析结果,找到TPM4对应的探针值;查看数据发现前三个探针logFC都是小于-1的,由于GEO2R得出的结果是normal:tumor。所以我们需要转换下思维;这里是TPM4在肿瘤中高表达。其中209344_at   logFC 绝对值大于1.5,故我们取这个探针数据就行演示。
⑤打开表达谱数据,提取组织分组和209344_at表达谱数据。可以看到sample_title和sample_characteristics_ch1均有标识分组信息
⑥ 通过excel转置功能整理TPM4表达谱数据
进一步整理为下图数据并命名为TPM4:
⑦ 进入生信工具的分析工具页面 → 【基础绘图】→【分组比较图】→【上传TPM4分组数据】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。哈哈,秒胜SPSS
我们可以通过同样的方式获得Fig.2b-d的结果。
Fig.3 在胰腺癌中,基于TCGA数据库,对TPM4进行OS预后分析。
Fig.4在胰腺癌中,基于TCGA数据库,对TPM4进行DSS预后分析。
Fig.3 4 是用同样的方式展示OS/DSS分析,我们以OS为例进行展示。
PS:a图暂时只能用R包来做,故我们这里暂且不做。
b. OS/DSS(/PFS)分析
方法一:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【临床意义(靠)】→【预后分析】→【KM曲线图】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)(→【展示风险表格】)→ 【OS/DSS/PFS】→ (【风格】里展示外框 → 【不展示删失数据】→ 【展示置信区间】)→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
小贴士:说明处展示了两种分析结果。
方法二:GEPIA
http://gepia.cancer-pku.cn/)  
步骤:【Survival】 →【Survival Plots】→ (搜索框输入【TPM4】)(默认前一项选择)→【Datasets Selection】选择疾病 →【Add】→ 其它参数默认(可通过点点点进行个性化调整)→ 【Plot】→ 结果就出来啦 → 结果下载。
c. 1年,3年,5年生存分析ROC曲线
方法:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【临床意义(靠)】→【预后分析】→【时间依赖性ROC曲线图】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→【编辑预测年限】(一般默认1,3,5)→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
Fig.5 在胰腺癌中,TPM4表达与TILs和Immune评分/Stromal评分的相关性。

复现方法:R语言,GEPIA,仙桃学术。我们这里展示后两种方法。

Fig.5a 总体肿瘤免疫浸润情况
方法:GEPIA2021
http://gepia2021.cancer-pku.cn/

首先点击【Proportion】→【选择疾病:PAAD】→【选择基因和免疫细胞 & 标准化】(但只能5种) → 【Plot】→ 【结果出来啦】(但目前为箱式图)。
Fig.5b TPM4与免疫浸润之间的关系
方法一:仙桃学术(https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【交互网络(联)】→【免疫浸润】→【棒棒糖图】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→ 展示所有细胞需调整【风格和图片大小】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
方法二:GEPIA2021
http://gepia2021.cancer-pku.cn/
首先点击【Sub-expression】→【选择疾病:PAAD】→【选择基因和免疫细胞】(但免疫细胞只能5种) → 【Plot】→ 【结果出来啦】(但目前为箱式图)。
Fig.5c TPM4与作者所选六种细胞之间的相关性。我们以T cell CD8 为例
方法一:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【交互网络(联)】→【免疫浸润】→【散点图】→ (选择【疾病】→ 输入分子【TPM4】)(默认前一项数据,故此处不需要做选择)→ 选择【CD8 T cells】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
方法二:TIMER2.0 
http://timer.comp-genomics.org/
首先进入TIMER2.0 【Immune】→【Gene】输入TPM4 → 【Immune Infiltrates】选择T cell CD8 → 【Submit】→ 肿瘤相关结果显示 →点击PAAD下的【T cell CD8 】的【0.411】 进入下一页面 → TPM4与T cell CD8 的相关性图就出来啦。
Fig.6 基于TISDB数据库,TPM4表达与TILs和Immune评分/Stromal评分的相关性
复现方法:TISIDB
http://cis.hku.hk/TISIDB/index.php
全景式反应与免疫分子的关系,与TIMER呼应
① 进入主页,在【Quick Search】输入【TPM4】; 点击【Submit】。
② TPM4基本信息   点击TPM4进入下一页面
③ TPM4与各种肿瘤28种TIL免疫相关基因的关系。单个免疫细胞我们还是以T cells CD8为例。
选择【Lymphocyte】→【全景图就出来啦】→ 进一步选择【PAAD】和【Activated T cells CD8】→ 点击【Plot】。在胰腺癌中,TPM4与Activated T cells CD8相关性图就出来啦。
PS: 此页面还包含其它选项:功能富集,免疫治疗,趋化因子,药物等。
Fig.7 TPM4表达与免疫检查点基因和趋化因子受体的相关性分析。
Fig.7a 雷达图
方法:仙桃学术 和  excel
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【交互网络(联)】→【分子相关性分析】→【单基因共表达热图】→ 选择【疾病】→ 输入分子【TPM4】和【分子列表】→【调整图片大小】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
这张图替代雷达图也很不错哟。
第二  雷达图制作
下载【相关性文件】并用excel打开。提取其它分子和相关系数,两种方法的相关系数均可,我们只需提取一种;复制黏贴至新的excel表格中。
方法一:仙桃学术
https://www.xiantao.love/
首先整理下数据
接着,进入生信工具的分析工具页面 → 【基础绘图】→【雷达图】→【加载整理好的数据】→【调整图片大小】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
方法二:excel
选中所有分子及其相关系数,点击【插入】→【雷达图标识】→【结果就出来啦】。
PS:结果与文章中出入是正常的,如果雷达图做出来不漂亮的话,推荐【单基因相关性热图】展示
此外,在excel中还可以调整样式,颜色,过滤数据哟!
Fig.7b-f TPM4与趋化因子之间的相关性。我们以CCL7为例。
方法一:TISIDB
http://cis.hku.hk/TISIDB/index.php
选择【Chemokine】→【全景图就出来啦】→ 进一步选择【PAAD】和【CCL7】→ 点击【Plot】。在胰腺癌中,TPM4与CCL7相关性图就出来啦。
此外本页面还展示了TPM4与趋化因子受体的相关性。
方法二:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【交互网络(联)】→【分子相关性】→【散点图】→ 选择【疾病】→ 输入分子【TPM4】和【CCL7】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
Fig.8 在胰腺癌中,TPM4相关的差异基因富集分析。
注:Fig.8 b需要R语言,我们暂且不做
复现方法及步骤
方法:仙桃学术
https://www.xiantao.love/
首先,我们做一下TPM4单基因差异分析。
进入生信工具的分析工具页面 → 【表达差异(挑)】→【差异分析】→【单基因差异分析】→ 选择【疾病】→ 输入分子【TPM4】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示】下载需在【历史记录】处 → 详细说明请查看下方【说明】。
第二 历史记录处下载单基因差异分析结果;首选excel表格下载。
第三 打开查看数据情况,可以看到Fig.8acd都是通过这个数据来做的。
第四 根据每个图的需求及仙桃学术作图格式整理相应的数据;并作图。
① 火山图 选取灰色的列即可。  进入生信工具的分析工具页面 → 【表达差异(挑)】→【火山图】→【上传文件】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
② GO和KEGG分析,选取所有UP & DOWN基因
# 进入生信工具的分析工具页面 → 【功能聚类(圈)】→【GO|KEGG】→【GO|KEGG富集分析】→ 【上传数据】或【复制黏贴至分子列表】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。小贴士:这一步结果一定要保存才可以进行可视化哟。
## 根据结果选取自己感兴趣的GO|KEGG ID或选择TOP10-20.下图为我们结合文中数据选取的ID。
###GO|KEGG可视化
进入生信工具的分析工具页面 → 【功能聚类(圈)】→【GO|KEGG】→【GO|KEGG富集可视化】→ 选取【GO|KEGG富集分析结果】→ 复制选取的ID至【基本参数】→ 调整【图片大小】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。哈哈,我们把KEGG与GO结果放一张图上啦。
PS:Fig.8 GO|KEGG分析部分作者仅选取了BP和KEGG部分,没有CC和MF,有些奇怪。最好是四部分结果都展示。
Fig.9 TPM4相关基因PPI网络分析

Fig.9a TPM4相关蛋白top50
复现方法:
Sting
https://string-db.org/cgi/) 
 cytoscape
(软件,官网下载https://cytoscape.org/
复现步骤:
① 进入STRING搜索页面→选择【protein by name】→输入TPM4入【protein name】点击【search】
②点击【CONTINUE】
③ 【setting】里面参数调整:【active interaction sources】仅选择【experiments】;【minimum required interaction score】选择【low confidence(0.150)】;【max number of interactors to show】的【1st shell】选择【no more than 50 interactors】。点击【UPDATE】即可获得Fig.9a。
④ 为了把图做的更美观些,我们将此结果发送到cytoscape。在【exports】目录下点击【send network to cytoscape】;cytoscape就接收到此图啦。PS:cytoscape需要安装string的插件哈。
⑤ 图形调整:运用【layout】调整基因球的大小与基因球大小之间的距离;此外layout里面有很多种图形形状调整。
Fig.9b 进一步筛选到 ACTA2, ACTG2, TNNT1
左图为准备的韦恩图,右图为结果。虽然我们结果与作者不一样,但我们下面的图还是用作者的数据。
具体步骤:
进入生信工具的分析工具页面 → 【基本绘图】→【韦恩图】→【上传制作好的文件】→ 选取→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
Fig.9c TPM4与ACTA2, ACTG2, TNNT1分子相关性分析;我们以ACTA2为例
方法一:仙桃学术
https://www.xiantao.love/
首先,进入生信工具的分析工具页面 → 【交互网络(联)】→【分子相关性】→【散点图】→ 选择【疾病】→ 输入分子【ACTA2】和【TPM4】→ 其它参数个性化调整(详见教程文档:每一页疾病/数据部分右上角) → 【确认】 →【结果展示&保存&下载】→ 详细说明请查看下方【说明】。
方法二:TIMER2.0 
http://timer.comp-genomics.org/
首先进入TIMER2.0 【Exporation】→【Gene_Corr】→【Interested Gene】输入TPM4 →【Gene Expression】输入ACTA2 → 【Submit】→ 肿瘤相关结果显示 → 点击PAAD行的【P值】的【0.678】 进入下一页面 → TPM4与ACTA2的相关性图就出来啦。
哈哈  我们除了必须用R语言处理的部分,其它部分一步一步的复现完成哈。整个过程下来有没有一定的收获呢?!希望对有需求的你有一点点帮助。
(0)

相关推荐