《数据可视化基础》第十章:多组分类变量数据可视化(二)
以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可以直接看原版书籍:https://serialmentor.com/dataviz/
巢式扇形图
在本章刚开始的时候,我们使用桥梁数据集来说明对于嵌套的分类变量可视化,使用马赛克图和树图式更合适的。但是同样的其实也是可以使用巢式扇形图来进行可视化的。
对于巢式扇形图的可视化有两个方法,第一种是画由一个内圈和一个外圈组成的扇形图。内圈现实一个变量的数据,外圈现实一个变量的数据。
另外一个可视化方式,则是把两个分类变量拟合成一个变量。进而进行一个扇形图的可视化。
并行流程图
如果我们想要对两个以上的分类变量的变化进行描述的话,那么马赛克图和树图以及饼状图就很难进行处理了。这个时候我们就可以使用并行流程图了(parallel sets plot)。
这次我们把桥梁的数据进行扩展。现在关于桥梁数据的描述有了四个分类变量。分别是:建筑材料(铁、钢、木材)、每座桥的长度(长、中、短)、每座桥建造的年代(工艺、新兴、成熟、现代)以及每座桥跨越的河流(阿勒格尼、莫农加赫拉、俄亥俄州)。在下面的并行流程图当中,我们使用见建筑材料这个分类变量来连接其他不同的分类变量。由下图可以看出:大多数的木头桥梁主要是中等长度的,其主要是在工艺时期建造的,并且这些桥梁主要建造于阿勒格尼河上。
对于并行流程图而言,我们想要观察什么变量的变化,就可以把这个变量设置成颜色的变化即可。同时需要进行可视化的两个原则是:
由于我们查看图的顺序是从左到右的,所以对于颜色变化的变量建议放到最左边。
对于数据的走向,建议从变化少到变化多的来排列。
基于以上两个原理,我们发现👇图中,👉比👈要好很多。
赞 (0)