图解|火山图怎么看
最近小编遇到越来越多咨询怎么看图的问题,索性就起一个“图解”专栏,抓出一些典型的科研图,讲讲这些图该怎么看,能传达什么意义。如果觉得有用,别忘点“在看”,让小编更有坚持下去的动力呀~
首先我们来看看今天的主角“火山图”长什么样:
嗯,基本元素就是这样,由多种颜色的圆点组成的图形。但在解图之前,我们需要先了解一下火山图的应用场景。一般在完成差异表达分析之后,会根据指定阈值筛选到一些差异表达基因,这时候就能通过火山图直观的展示出差异效果。这里的指定阈值包括adjusted p-value(或p-value)和Fold Change。
p-value:表示某个基因在比较分组之间的表达差异是否足够显著,一般认为p-value<0.05为显著。 adjusted p-value:即经过统计学方法校正后的p-value,由于统计学上常用的校正方法包括“BH”、“FDR”等,所以在一些文章中,我们也会看到筛选差异基因的阈值是FDR<0.05。 Fold Change:表示两个分组之间的差异倍数,其绝对值越大说明某基因在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调。画图时,一般转换为log2FoldChange,使展示更直观。
现在,我们一起来看图。图的横、纵坐标分别是我们上述介绍的阈值:log2FoldChange和经过log转换的adjusted p-value,分别衡量差异的倍数和显著性。图中每个圆点代表一个基因,但这些基因分别具有不同颜色,颜色的意义可以参考图片右侧的图例:
UP:差异显著且上调的基因; DOWN:差异显著且下调的基因; NOT:差异不显著的基因。
比如我将“adjusted p-value<0.05”且“log2FoldChange的绝对值大于1”的基因筛选为差异表达基因。那么在绘制火山图时,
“adjusted p-value < 0.05”且“log2FoldChange > 1”的基因将展示为红色圆点,即UP; “adjusted p-value < 0.05”且“log2FoldChange < -1”的基因将展示为蓝色圆点,即DOWN; 而“adjusted p-value > 0.05”的基因将展示为黑色圆点,即NOT。
横坐标绝对值越大,说明基因在两分组之间的差异越大;纵坐标值越大,说明基因在分组间的表达差异越显著,结果越可靠。 火山图在文章中就是对差异分析结果可视化的作用,让差异结果更生动。目前有多种绘制火山图的方式,如geom_point、EnhancedVolcano等,具体可以查看函数说明文档了解。
赞 (0)