解螺旋公众号·陪伴你科研的第2533天
在pubmed搜索ceRNA,发现很多实验类的文章,做了很多内容,但是只发了2-3分,所以今天想和大家一起学习2021年1月发表于Molecular Therapy Nucleic Acid的ceRNA的肿瘤生信文章,看看这篇纯生信的文章是如何做到7+的水平的。
文章题目
Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma
期刊简介
题目:Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma疾病:肝细胞肝癌(hepatocellular carcinoma,HCC)分析策略:差异表达 + 功能聚类 + 临床意义 + 交互网络 + 甲基化分析 + 免疫分析(https://www.xiantao.love/products)(https://www.proteinatlas.org/)(http://www.cbioportal.org/)(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/)(http://microrna.gr/tarbase/)(http://www.targetscan.org/vert_71/)(http://ualcan.path.uab.edu/)◆ DiseaseMeth version 2.0数据库(http://bio-bigdata.hrbmu.edu.cn/diseasemeth/)(https://cistrome.shinyapps.io/timer/)总体来看,作者先从TCGA数据库中挑出HCC(肝细胞肝癌)的样本,并对肿瘤vs正常以及PTEN高低表达进行差异分析,筛选出差异表达的lncRNA、miRNA、mRNA(图2和图3),构建ceRNA调控网络(图4),并对此ceRNA调控网络进行富集分析(图4)、生存分析(图6)、亚细胞定位分析(图7)、分子相关性分析(图7)、甲基化分析(图8)、免疫分析(图9)等,涉及到差异表达(挑),功能聚类(圈),交互网络(联),临床意义(靠)的各个方面,内容丰富饱满,非常值得学习借鉴。详细解读如下 ▼本文一共9个主图,6个附表,7个附图,很多附图表和主图的绘制方法类似,就不再重复,这里只复现了主图和有代表性的附图表,现在就开始吧。流程图用PPT、思维导图软件、photoshop等都能实现,这里不再赘述。图2、PTEN在人类肝细胞癌(HCC)中的抑癌作用▼进入HPA数据库:https://www.proteinatlas.org/往下拉,就能看见【RNA EXPRESSION OVERVIEW】,截图保存即可。▼(注:作者这里犯了个小错误,此图是正常组织的PTEN表达情况,而被作者标注成了pan-cancer了。)(注:作者这里也标注错了,附图1应该是PTEN在泛癌中的表达)仙桃学术的生信工具不仅能一键完成此图,还有非配对样本和配对样本的对比,一起来看看吧~进入仙桃学术生信工具:https://www.xiantao.love/products(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)【分析工具】 → 【表达差异(挑)】 → 【非配对样本】 → 【泛癌】 → 输入分子【PTEN】 → 调整图片颜色和大小 → 【确认】▼这里就可以看到PTEN在33种肿瘤的非配对样本中的表达情况了。此时即“保存结果”到云端的历史记录,也可用其他格式保存到电脑中。▼(小贴士:建议后续需要拼图的图片均选择“保存结果”,这样可将保存的结果直接在“拼图工具”中进行拼图,省去了后面上传图片的步骤,咱们能偷懒就尽量偷懒,把时间花在更必要的地方,对吧~)【配对样本】 → 调整图片颜色和大小 → 【确认】▼(小贴士:现在仙桃学术的记忆力变好的哟,上次搜索的内容,比如【泛癌】、【PTEN】都记在仙桃的小脑袋瓜里,下次检索的时候,只需要再看看是不是自己需要的疾病和分子,更换分析方法就好啦~ 懒癌星人的福音哈哈~)换个图片,继续【图片另存为】,完成后可点击左上角的x把图片关闭。▼肿瘤样本用类似的方法,【PATHOLOGY】 → 【CANCER】→ 【LIVER CANCER】▼图2C PTEN高低表达的Kaplan-Meier生存曲线▼仍然可在仙桃学术生信工具(https://www.xiantao.love/products)中完成。【临床意义(靠)】 → 调整预后参数 → 【确认】 → 【保存结果】或【下载图片】▼图2D cBioPortal的OncoPrint图显示TCGA-HCC中PTEN基因组改变的分布 ▼进入cBioPortal主页(http://www.cbioportal.org/)选择【Liver】 → 找到【Liver Hepatocellular Carcinoma】 → 点击【Query By Gene】▼(小贴士:这里有很多【Liver Hepatocellular Carcinoma】,可以根据需要选择一个或多个研究数据,这里根据原文选择了TCGA数据,一般来说,选择CNS级的数据更可靠哦〜)选择【Mutations】和【Putative copy-number alterations from GISTIC】 → 输入目的基因【PTEN】 → 【Submit Query】▼图2E cBioPortal中PTEN拷贝数与mRNA表达之间的关联 ▼接着上一步,【Plots】 → 【Download】▼图2F cBioPortal中PTEN拷贝数与mRNA表达之间的相关图▼接着上一步,选择【Log2 copy-number values】→ 取消【Mutation Type】和【Copy Number】前的选择 → 在【Show Regression Line】前打勾 → 【Download】▼还是在仙桃学术的生信工具(https://www.xiantao.love/products)点击【基础绘图】 → 点击【上传图片】 → 选择图片并上传 → 【确认】 →【保存结果】至云端。除了在仙桃中完成并保存的图片,其他图片都逐一上传。▼将所有图片都上传并保存至云端以后,打开【拼图工具】 → 拖拽图片至空白处 → 调整图片大小和位置 → 调整【ABC标注】格式。▼这就是完成拼图的结果了,全部自动标注好了ABCD呢〜▼图3 HCC样本中PTEN高低表达之间的差异lncRNA、DEmiRNA、DEmRNA的火山图和热图▼在仙桃学术中【生信工具】 → 【分析工具】 → 【表达差异(挑)】 → 【单基因差异分析】 → 选择【肝细胞肝癌】 → 分子输入【PTEN】 → 【确认】 ▼(小贴士:此分析所需时间略长,请耐心等待哟〜 待会儿你就会发现,等待非常值得〜)在【历史记录】中可以看到分析的状态仍然是【执行中】▼待状态变为【完成】时,即可下载结果了。这里我们需要【Excel表格下载】和【差异lncRNA】▼【表达差异(挑)】 → 【火山图】 → 上传刚刚下载的【差异lncRNA】 → 选择【基本参数】(文章中用的是logFC >0.5, P<0.05) → 输入标题【lncRNA】→ 【确认】 → 【保存结果】或下载图片▼(小贴士:其实火山图的示例数据中只有【gene_name】、【logFC】、【adjP】,不小心发现其实可以将上一步下载的结果直接上传,不用麻烦的整理数据,就迫不及待的把这个偷懒的小招妙告诉你萌啦~)点击【gene_biotype】旁边的小三角 → 选择【miRNA】 → 【确定】▼这样就将所有的miRNA筛选出来了,将所有筛选出的数据复制粘贴到一个新的Excel文件,取名“miRNA”,保存。▼用同样的方法筛选【gene_biotype】为【protein_coding】的行,保存为“mRNA”文件。▼按照lncRNA的方法,分别上传文件,就能得到相应的火山图了。(小贴士:其实用筛选miRNA和mRNA的方法来筛选lncRNA,得到的结果和直接下载的结果是一模一样的,大家有兴趣可以尝试一下~)图3D-E 15个差异最大的lncRNA、miRNA、mRNA的热图 ▼打开保存好的差异miRNA的Excel文件,新建一列【abslogFC】 → 下一行写公式【=abs()】 → 用鼠标点一下【log2FoldChange】下的第一个数字 → 按回车键 ▼把鼠标放在这个数字的右下方的绿点处,等鼠标从╬变成+,双击鼠标 ▼【abslogFC】这一列就自动算出所有【log2FoldChange】的绝对值了▼【筛选】 → 【pvalue】旁边的小三角 → 【数字筛选】 → 【小于】 ▼(小贴士:一般选择【padj】,就是校正后的p值,但因此数据【padj】缺失值较多,所以选择了【pvalue】,所以具体情况要具体分析哦~)选中【abslogFC】列 → 【筛选】 → 【降序】 ▼这样,就选出了P<0.05的行,并且按照logFC的绝对值从大到小进行了排列。现在只用选中前15个基因名,复制就好了▼进入仙桃学术生信分析工具 【交互网络(联)】 → 【单基因共表达】 → 选择【肝细胞肝癌】 → 输入目的分子【PTEN】 → 【标题文本】中输入【miRNA】 → 将上一步筛选出的相关基因粘贴至【分子列表】 → 【确认】 → 【保存结果】或【下载结果】▼(小贴士:如果直接从TCGA数据库下载数据画热图,需要经过数据下载、合并、清洗、基因名称转换、寻找相关基因、排序、数据整理、绘制热图等复杂的步骤和程序,而在仙桃学术不仅能轻松搞定,还能获取更加丰富的信息哦~)用同样的方法画出其他图片,并拼图,即可得到以下结果▼图4 lnRNA-miRNA-mRNA调控网络的构建和功能富集分析▼此图主要是在Metascape数据库(http://metascape.org/)中完成的。(小贴士:虽然仙桃学术也能做相应分析,但是目前只能分析700个基因,对于此次分析有点容量不足。仙桃学术的技术小哥哥无所不能,所以大家有什么需求,直接在本文下方或者公众号里许愿,大家的呼声高了,愿望就能早点实现啦~ 顺便也给技术小哥哥一点压力,哈哈哈哈~)将所有的差异lncRNA+miRNA+mRNA名字都粘贴到【list】 → 【Submit】 → 选择【H.sapiens】(代表人类) → 【Expression Analysis】 → 等待一段时间,直到下方100分 →点击【Analysis Report Page】▼(小贴士:这里可以上传文件的,也许是网速原因,多次尝试上传文件都没有成功,所以最终选择上传list,网速好的小伙伴们也可以试试直接上传文件哦~)图5 TCGA-HCC数据集中ceRNA调控网络的13种Hub-RNA表达模式的分布▼【表达差异(挑)】 → 【非配对样本】 → 【TCGA-LIHC】 → 【点图】 → 输入目的分子,如【DLEU2L】 → 【统计分析】选择【p=科学计数】 → 【确认】 → 【保存结果】或下载 ▼每个小图的做法都类似,只需更改目的分子的名字就好了。每个小图的做法也都类似,只需更改目的分子的名字就好了。【分析工具】 → 【临床意义(靠)】 → 【KM曲线图】 → 【TCGA-LIHC】 → 输入目的分子,如【DLEU2L】 → 【确认】 → 【保存结果】或下载 ▼图7A 三种lncRNA(DLEU2L,FAM99A和ARRDC1-AS1)的细胞定位▼进入LNCipedia(https://lncipedia.org/)主页 → 输入目的分子,如【DLEU2L】 → 搜索 ▼进入lncLocator(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/),将刚刚复制的序列粘贴进来 → 【submit】 ▼页面最下方即可得到lncRNA在细胞中的分布比例 ▼图7C 用TarBase预测DLEU2L与miR-99a-5p和miR-100-5p的靶位点之间的碱基配对,用TargetScan预测TAOK1 3'UTR与miR-99a-5p和miR-100-5p的靶位点之间的碱基配对▼TarBase数据库(http://microrna.gr/tarbase/) → 输入目的分子,如【DLEU2L】 → 选择【Homo sapiens】 → 【Apply】即可得到与DLEU2L结合的miRNA分子▼TargetScan数据库(http://www.targetscan.org/vert_71/)选择【Human】 → 输入目的分子,如【TAOK1】 → 【Submit】▼找到【Human】 → 下方即为【TAOK1】与miRNA的结合位点▼图7D 肝癌中四个预测性RNA之间及其与PTEN的相关性分析▼回到仙桃学术生信工具(https://www.xiantao.love/products) → 【交互网络(联)】 → 【散点图】 → 选择【肝细胞肝癌】 → 基因A输入【PTEN】 → 基因B输入【DLEU2L】 → 【确认】 → 【保存结果】▼好吧,图8A还没有找到在线的工具可以完成,只能用R语言了,希望仙桃学术的技术小哥哥能早点搞定~进入UALCAN数据库(http://ualcan.path.uab.edu/) → 【TCGA analysis】▼输入【TAOK1】 → 选择【Liver hepatocellular carcinoma】 → 【Explore】▼图8C 使用DiseaseMeth 2.0版评估甲基化▼DiseaseMeth version 2.0 (http://bio-bigdata.hrbmu.edu.cn/diseasemeth/) → 【Analyze】▼选择【Liver hepatocellular carcinoma[LIHC]】 → 输入【TAOK1】 → 选择【Array-based technology】 → 【Analysis】▼选择【NM-025142】 → 【Analysis】▼选择【chr17:277_5942-27718446】 → 【Analysis】▼图8D MEXPRESS数据库中显示TAOK1的DNA序列与基因表达的甲基化位点▼MEXPRESS数据库(https://mexpress.be) → 输入【TAOK1】 → 选择【LIHC】 → 【PLOT】 → 出现图片后【Download】即可 ▼图9 肝癌组织中TAOK1表达与免疫浸润的相关性分析▼图9A HCC中TAOK1基因拷贝数与免疫细胞浸润水平之间的关联▼TIMER数据库(https://cistrome.shinyapps.io/timer/) → 【SCNA】 → 选择【LIHC】 → 输入【TAOK1】 → 【Submit】 → 出现图片后下载即可 ▼图9B TAOK1表达与HCC免疫浸润水平的相关性▼TIMER数据库 → 【Gene】 → 输入【TAOK1】 → 选择【LIHC】 → 【Submit】 → 出现图片后下载即可 ▼TIMER数据库 → 【Survival】 → 选择【LIHC】 → 输入【TAOK1】 → 【Plot KM Curve】 → 出现图片后下载即可 ▼探索基因间相互作用和功能,除了string还有更友好的它!绝了!9+纯生信文章,我用15分钟零代码教你复现!老底儿都没了(附详细操作教程)