绝了!9+纯生信文章,我用15分钟零代码教你复现!老底儿都没了(附详细操作教程)
解螺旋公众号·陪伴你科研的第2520天
高分生信生信文章怎么做?

(http://kmplot.com/analysis/index.php?p=background)
(http://gepia.cancer-pku.cn/)
(https://www.cbioportal.org/)
Figure 1
8种E2Fs在乳腺癌中的转录水平




把光标放在需要填色的格子里,点击填充颜色--其他颜色 点击【自定义】,将RGB颜色填我们上一步取色到的数值,点击【确定】 这样第一个格子就填好颜色,同样的步骤做完,就可以得到一张无论放大多少倍都不会糊的高清原图啦


生信高级版选择【表达差异】
【非配对样本】
癌种选择泛癌
分子输入E2F1
点击【确认】,同样的,将E2F2-8用同样的方法拼接起来,即可得到Figure 1






Figure 2
E2Fs基因表达水平和乳腺癌临床病理参数的关系

打开GEPIA网址,在【enter gene name】输入E2F1, 继续点击【GoPIA】 点击【Expression DIY】选择【Profile】 输入基因【E2F1】 选择BRCA癌种 点击【plot】 E2F1在乳腺癌中的表达图可直接下载,同样的步骤将E2F2-8表达图画出来拼接到一起即可得到Fig 2A


点击【Expression DIY】选择【Boxplot】 在gene一栏输入【E2F1】 选择癌种【BRCA】 点击【plot】 图形显示出来,点击右上角的下载按钮,同样的步骤将剩下的E2F2-8补齐,即可得到Fig 2B。

生信工具高级版选择【表达差异】 选择【非配对样本】 选择BRCA 输入目标基因 点击确认,这样E2F1在乳腺癌中mRNA表达水平就表示好了,同样的步骤,将E2F2-8都画出来,拼接好,即Fig2B。

Figure 3
分析了E2Fs在乳腺癌肿瘤分期中的表达

点击【Expression DIY】选择【Stage plot】 Gene一栏输入E2F1 选择癌种BRCA 【plot color】这里可以任意选成自己喜欢的颜色,文中作者选了红色,这里我们也选择红色 点击【plot】 点击下载按钮,同样的步骤将E2F2-8分析出来,拼接到一起即可得Figure 3

Figure 4
利用IHC(免疫组化)检测E2Fs蛋白在乳腺癌组织中的表达
在这里我们依然以E2F1为例,输入基因【E2F1】 点击【Search】 选择【Pathology】 在蛋白表达里选择【Breast cancer】 会出现非常多已经染好的免疫组化片子,这个软件的优点也在于染出来的片子会配备很详细的病人信息,比如说年龄,染色的深浅程度,染色位置位于胞浆还是核,抗体信息等。 同样的步骤将E2F2-8图拼接起来即可得到Figure 4




Result 3
证明了E2F1,2,3,5,7,8高表达,E2F4,6低表达和乳腺癌患者的预有关系
点击首页【breast cancer】进入分析页面 在gene symbol这一栏输入【E2F1】 【use multiple genes】这里可以输入多个基因,批量进行生存分析,这个功能非常适合本篇文章,对E2F基因家族进行分析,这里先用E2F举例。 这里【split patients by median】可以根据基因表达量将样本分为高低两组,这里支持按照均值等多种统计量来分类,这里我们选择median分析。 KM-plotter支持多种事件的生存分析,对应不同类型
这里可以个性化筛选,根据自己的需求筛选临床信息,这一步,我们本次复现不需要选 确定之后,点击【Draw Kaplan-Meier plot】可以直接出图。



进入高级版仙桃工具,选择【预后分析】--【KM曲线图】 选择癌种(乳腺癌) 输入基因名称 预后参数可根据需要选择OS,DSS,PFI 点击确认,这里和文章中数据不太一致,生信工具里收录的数据更全更新一点,在这里,KM-Plotter结果和生信工具结果如何取舍的话,我建议以生信工具为准。

Result 4
对乳腺癌患者的E2Fs因子及其邻近基因的功能富集分析

进入cBioportal,选择Breast数据集,文章中说选择了1105的数据集,但是目前从cBioportal收录的乳腺癌中只有这个Breast Invasive Carcinoma(TCGA,PanCancer Atlas)包含1084个样本复现出的结果和文章最相似,所以我们就用这个数据集进行复现。

这一步根据需要要不要选mRNA Expression,这里我们主要想看突变情况,所以勾选了前两栏 输入E2F基因家族 点击【Submit Query】 选择【Cancer Types Summary】 即可得到E2F家族在乳腺癌中的突变频率,即Fig 6A1 点击【OncoPrint】列出E2F基因家族的突变频率,即Fig 6A2




点击【Co-expression】 E2F1蓝色代表着分析的正是E2F1和其他基因的相关性 在搜索框搜E2F2 右边图中经过Pearson校正后为0.46 同样的步骤可以得出E2F1与E2F3-8的相关性分别为0.27,0.31,0.25,0.24,0.43,0.41,我们可以利用得到的这些数字,用EXCEL画出如Fig 6B的热图。



点击【similar genes】 输入基因E2F1 选择【BRCA】癌种 得到相关性排名前100的基因,同样的方法得到E2F2-8相关性前100的基因,取交集。

选择解螺旋生信工具的交互网络(联)模块 选择【分子相关性分析】 单基因相关性筛选 选择【乳腺浸润癌】 分子输入E2F1,点击确定, 然后我们可以在历史记录里找到【单基因相关性分析】我这里下载的是EXCEL表格,同样的操作,将E2F2-8的表格都下载完成




Figure 7
GO和KEGG通路富集分析

利用我们仙桃学术工具,选择【功能聚类(圈)】 选择【GO/KEGG富集分析】 输入我们上一步得到的50个相关基因的分子列表 点击确认 我们推荐先点击【保存结果】,然后下载word三线表,结果如下图所示,这样的表格可以直接放在文章当中,但是如果我们想以图形展示的话,就再进行可视化


接着这一步进行可视化操作,依然是【功能聚类(圈)】,下一步选GO/KEGG可视化 选择上一步我们保存的结果 其他参数一般保持默认即可,点击确认 将可视化的图形保存,可直接用在文章里。即得到Figure7和Figure8两张图(作者在这里可能是为了凑图,将GO和KEGG分成两张Figure,其实完全可以放在一张图上展示,这里就看各位的心情了)










赞 (0)