《数据可视化基础》第十二章:时间序列数据可视化(二)
以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可以直接看原版书籍:https://serialmentor.com/dataviz/
12.3 两个或多个响应变量的时间序列
在前面的示例中,我们只处理了单个变量是时间序列的数据。然而,有一个以上的响应变量并不罕见。这种情况在宏观经济学中很常见。例如,我们可能对过去12个月的房价变化感兴趣,因为它与失业率有关。我们可以预期,失业率低时房价会上涨,反之亦然。
有了来自前面小节的介绍,我们可以将这样的数据可视化为两个堆叠在一起的单独折线图。此图直接显示了感兴趣的两个变量,并且很容易解释。但是,由于这两个变量被显示为单独的折线图,在它们之间进行比较可能很麻烦。如果我们想要确定两个变量在相同或相反方向移动时的时间区域,我们需要在两个图形之间来回切换,并比较两条曲线的相对斜率。
作为显示两个单独的折线图的另一种选择,我们可以将两个变量相对地绘制,绘制从最早的时间点到最近的时间点的路径(图13.10)。这样的可视化称为连接散点图,因为我们在技术上做了一个两个变量相对的散点图,然后连接相邻的点。物理学家和工程师通常称其为相位图,因为在他们的学科中,通常用它来表示相空间中的运动。我们之前在第3章中遇到过连接的散点图。
连接的散点图,线的方向从左下角右上角表示两个变量之间的相关运动,例如从左上到右下,代表代表两个变量存在反向作用关系(一个变量增加,其他减少)。如果这两个变量有某种循环关系,我们将在连通的散点图中看到圆或螺旋。在👆,我们看到一个从2001年到2005年的小圆圈和一个在剩余时间中的大圆圈。
当绘制一个连通的散点图时,我们指出数据的方向和时间尺度是很重要的。如果没有这样的提示,图形可能会变成毫无意义的涂鸦。
即使连接的散点图一次只能显示两个变量,我们也可以使用它们来可视化高维数据集。技巧是首先应用降维(参见第11章)。然后我们可以在降维空间中绘制一个连通的散点图。作为这种方法的一个例子,我们将可视化一个由圣路易斯联邦储备银行提供的每月对100多个宏观经济指标观察的数据库。我们对所有指标进行主成分分析(PCA),然后绘制一个连接的PC 2与PC 1的散点图。