生信加实验文章解读
目前对于很多高分文章其实好多都是组学+实验的方式来做的。只不过各自比重不一样。好一些的可能只是那组学数据当作一个引子,中等的可能就是大部分是数据分析后面的实验只是来简单的拔高一下文章的分数。比如,我们今天分享这篇文章,为什么选择这样一篇文献和大家分享呢
文章分为两个部分,生信分析和实验验证。
生信分析
生信➕实验的文章,生信分析的第一步,往往都是通过分析来或者某一个类型的核心基因。进一步的在对这些核心基因进行实验。基本上为了丰富这些核心基因筛选的过程。类似富集,PPI呀各种的也会都做。
对于第一部分的分析,作者首先利用GEO数据库中的三个胰腺腺癌数据集(GSE62452, GSE28735 和GSE16515)进行基因差异表达分析,并利用Robust Rank Aggreg算法对三个数据集结果进行整合,最终获得389个差异表达基因,
进一步的,作者对这三个数据集的基因进行了聚类可视化。关于这个部分的目的,作者也没有进行详细的说明。估计也就是想来展示一下三个数据集当中的差异基因的表达情况吧。另外的话,如果要对三个数据集进行聚类的话,那其实第一步应该是去除批次然后在进行聚类。对于不同平台的数据,作者这里使用了一个叫YuGene的R包来进行整合。这个如果要遇到不同平台整合需求的同学可以试一下。
随后作者对差异表达基因进行GO分析和KEGG富集分析。其实也做了PPI。但是图片在附件当中,我们也就不放了。
随后作者想要找到胰腺腺癌的诊断及预后标志物,首先通过fisher确切概率法确定胰腺腺癌的top10关键基因,并利用聚类分析进行验证,发现top10基因能够很好的区分胰腺腺癌和正常胰腺组织。
得到top10基因后,进行诊断效能分析,最终发现TMPRSS4, SERPINB5, SLC6A14, SCEL 和TNS4具有作为胰腺腺癌诊断标志物的潜能。
同时对top10基因进行预后分析,显示TMC7, TMPRSS4, SCEL, SLC2A1, CENPF, SERPINB5 和 SLC6A14与胰腺腺癌患者生存时间紧密相关。
实验验证
文章的第二部分是实验验证,作者利用99例胰腺腺癌组织和71例正常胰腺组织对TMC7, TMPRSS4, SCEL, SLC2A1, CENPF, SERPINB5 和 SLC6A14 七个潜在的生存相关蛋白进行免疫组化染色,结果显示SLC6A14, TMPRSS4, SLC2A1和 SERPINB5在胰腺癌二期患者组织中表达显著高于一期患者。
并且利用临床数据再次验证了TMC7, TMPRSS4, SCEL, SLC2A1, CENPF, SERPINB5 和 SLC6A14 的mRNA水平与胰腺癌患者预后显著相关。
为了鉴定7个蛋白质在胰腺腺癌中的潜在生物学作用。进行了软琼脂集落形成实验和transwell实验,以研究这7个蛋白对胰腺腺癌细胞的增殖和侵袭的影响。在人胰腺癌细胞系中敲减七个基因。Western证实了敲减效率。集落形成实验显示,与对照组相比,7个蛋白敲低组均显示细胞克隆数减少,同时侵袭能力减弱。
写到最后
基本上文章的主要内容就是这些。总的来说,其实前面的分析以及后面的实验都是很基础的实验。相对来说要做的话还是很简单的。所以大家还是可以借鉴一下的。当然相同的东西能不能发相同的分数就另说了。