年度观察 | 信息可视化领域八大前沿趋势

信息可视化(Information Visualization),即用视觉容易感知的图形、符号来呈现数据。信息可视化致力于解决:如何清晰、高效、美观、有趣地呈现数据,从而帮助人们更好地理解、领会数据中的内涵。在大数据时代,信息可视化的价值不言而喻。
过去一年,信息可视化领域涌现了诸多有趣的工作和可圈可点的成绩。笔者结合学术界的最新研究成果(主要包括可视化领域的顶级会议IEEE VIS和ACM CHI)以及业界的创新实践,总结出八大可视化领域的前沿趋势,希望带你领略数据之美(趋势的排名不分先后):

1.交互技术与可视化的持续融合

随着电子设备的发展,可视化早已不再“静止”,各式各样的交互设计正在拓宽图表想象力。
例如,北邮可视化与人机交互研究组的作品《来自星星的你》将一份科技工作者心理状况的调查数据呈现为了一片星空,每一颗星星代表一位受访者,星星的外观由受访者的各项数据(如心理疾病类型、是否受到歧视等)决定。这个作品支持缩放、框选等交互行为,为用户提供了丰富的探索数据的渠道。
来自星星的你——科技工作者心理调查可视化[1]
江南大学数字媒体艺术系作品《流动的边界》对新冠疫情数据进行了可视化,这一作品将数据置于三维空间中,同时大量利用了鼠标点击、滚动、拖拽等交互行为,使得用户在与数据互动的过程中,感受到十足的震撼力。
流动的边界[2]
当然,随着传统的鼠标交互走向成熟,新型的交互形态也在出现,其中最主要的一项就是沉浸式交互。例如,纽约时报为了向民众普及戴口罩的好处,使用了手机AR技术,真实模拟了口罩中的纤维是如何阻隔粒子的:

Masks Work. Really. We’ll Show You How[3]

在2020年的IEEE VIS大会上,也有许多论文在提出新颖的交互方案。比如,Lee等人把一些经典的可视化图表用VR实现了出来:

Data Visceralization: Enabling Deeper Understanding of Data Using Virtual Reality[4]

在原本的图表中,数据停留在二维,人们很难直接感受到速度、高度的差异。而在VR中,你可以直接站在博尔特旁边,或是站在埃菲尔铁塔下,领略数据的真实尺度。
令人兴奋的是,这样的AR/VR设计正在离普通人越来越近,因为相关的技术正在被封装成简单易用的工具和系统。感兴趣的读者可以在文末的参考文献中查看[5][6]。
再进一步,数据的交互既然可以脱离鼠标,那么是否也有可能脱离屏幕?对于普通人来说,是否有可能不使用电子设备、不佩戴任何设备,就与数据实现交互呢?基于这一思路,一些人开始尝试将数据实物化(Physicalization),即把数据转化成可触摸、可闻、甚至可以品尝的形式。这种实物化的数据,可以较好地调动起人的参与感、激发人的情感,很适合应用在博物馆、艺术展览等场景。
Scents and Sensibility- Evaluating Information Olfactation[7]
可以闻的可视化
下面这一项目把人体的解剖数据做成了一个个可以玩耍的“纸盒子”。使用不同颜色的镜片去观察这些纸盒子,你可以看到人体的不同层次,例如骨骼、内脏等。有了这样的设计,生物课或许会不再枯燥。
The Anatomical Edutainer[8]

2.个性化、个人化的可视化设计范式兴起

随着绘制图表变得越来越简单,人们开始思考:怎么样让图表更有个性呢?
去年,Vivo手机推出的OriginOS系统让笔者印象深刻。其中的“行为壁纸”功能就是一个典型的可视化个性设计——用户的运动数据被映射到花朵上,随着步数增加,花朵也会随之盛开。许多用户被这种新颖的可视化吸引,网上甚至出现了 “为看花开步数上万,一个壁纸比健身教练管用” 的调侃。
类似的,在学术界,研究人员也在探索,如何帮助人们制作出更有个性、千人千面的可视化。例如,DataQuilt是一个可视化创作系统,它支持从图片中提取素材,并生成象形图。其生成结果有一种贴纸、贴画的可爱感。
DataQuilt- Extracting Visual Elements from Images to Craft Pictorial Visualizations[9]
Dear Pictograph支持在VR环境中,绘制属于自己的象形图:
Dear Pictograph- Investigating the Role of Personalization and Immersion for Consuming and Enjoying Visualizations[10]
有一些简单好用的小工具也可以定制可视化。在下图的地图工具中,海拔被描绘为类似山岭的效果,用户可以自己调整山岭的高度和颜色。笔者试着编辑了一下亚洲,很快得到了接近古代山水画的效果。
Peak-map[11]

3.感知/认知的基础研究进一步深入

可视化的底层科学很大程度上是心理学。在过去几十年的时间里,许多基本问题已经得到解决。在这些理论的基础上,我们形成了一些惯用的可视化规则,比如,用柱状图来表现数值差异,用颜色来分类,用散点图来查看相关关系,等等。
但是,现实中的情况往往十分复杂。比如,当散点图真的很“散”的时候,人的感知还会准确吗?因此,有学者专门检验了这种“不确定”(Uncertain)的情况,从而更深入地了解人的感知误差和偏见。
A Bayesian cognition approach for belief updating of correlation judgment through uncertainty[12]
此外,也有不少人提出,以往针对可视化的心理研究,太过偏重于测量感知(Perception),而忽略了人在观看、使用可视化时还涉及许多的其他心理现象,例如决策的形成(Decision Making)、态度观念的更新(Belief Updating)等。在2020年,有学者开始系统性地将视觉科学中的研究变量和实验方法引入可视化领域[13]。
因此,可以预见的是,可视化将拥抱更加多样的心理学研究方法。未来,我们评价一个可视化的视角也会更加多元。

4.可视化的沟通传达作用得到强调

近年来,可视化的沟通、传达能力日益得到重视,“用数据讲故事”的理念被广泛应用。
这一趋势首先体现为讲故事的形式不断丰富。例如,Wang等人探索了“数据漫画”(Data Comics)的应用场景,指出这种漫画可以替代一些原本枯燥的数据报表:
Data Comics for Reporting Controlled User Studies in Human-Computer Interaction[14]
Shu等人研究了在社交网站上广受欢迎的数据动图(Data Gifs)。这种动图类似表情包,是一种易于传播的“轻视频”形态:
What Makes a Data-GIF Understandable?[15]
笔者今年参与的一篇论文,研究了数据视频(Data Video)中的动画是如何辅助故事叙述的。我们发现,动画可以服务于至少8种叙事任务,包括强调、比较、悬疑、转折等。
2020年,各大可视化工具平台也在新版本中强调了数据的叙事能力。比如最新发布的Echarts 5,支持对图表添加动画,并且加强了数据之间的转场效果。
Apache ECharts 5 动画功能[16]

另一方面,数据叙事的效果也值得关注——受众的反馈究竟如何?数据的传达是否有效?要回答这些问题,往往需要站在受众的角度、以受众为中心来思考。

去年,一张由英国金融时报设计的疫情图表,在世界范围内广泛传播。

这张图表把各个国家放在同一起跑线上,同时在展示确诊人数时,使用了对数坐标轴(而非线性坐标轴),从而更加方便数据比较(参见我们之前的文章)这一设计之所以成功,核心在于它可以快速回答一些读者关心的问题:我们国家的疫情发展趋势如何?跟其他国家比算严重吗?增加到N个病例还要多少天?由此,图表设计师成功地实现了与读者的沟通。

不过,即使是这样精巧的设计,依然可能存在沟通失误的可能。其设计师John Burn在最近的一场分享[17]中提到,一些读者认为对数坐标轴在视觉上营造出了疫情在放缓的感觉,因此有帮助政府欺骗民众的嫌疑。他进而提到,用户的思维、感知模式、价值观往往都是非常多样的,这导致不同人对于可视化的解读也会产生差异。因此,要设计一个用于沟通传达的可视化,必须更多地将用户思维、用户情感纳入考量。

5.可视化的社会意义得到彰显

2020年见证了数据新闻的长足进步。在疫情的影响下,全球媒体大量使用数据可视化来描绘疫情态势、科普医疗知识、反思社会制度。数据可视化,对于引发公共讨论、推动民意转变,产生了切实的作用。
例如,人大RUC新闻坊的作品《2286篇肺炎报道观察:谁在新闻里发声?》收集并分析了2286篇疫情报道,从多个角度反思了新闻媒体在疫情中的表现——按时间顺序看,财新的响应速度最快,在疫情之初最为积极发声。从采访来源看,一线医疗工作者和普通市民在采访中的比重上升。数据表明,在重大公共卫生事件面前,及时的信息公开、允许多种声音存在,是十分关键的。这一作品也获得了2020中国数据内容大赛的“最佳数据运用金奖”。
2286篇肺炎报道观察:谁在新闻里发声?[18]
而获得“最佳数据内容金奖”的作品《“癌症村”的历史切片》,整理、分析了348个活在公共话语中的“癌症村”。作者们试图反思:这些村子是如何变成人们口中的“癌症村”的?是否有权威机构承认癌症聚集的事实?大部分“癌症村”形成的主因是什么?

这篇作品以“公共话语的形成”作为研究出发点,结合客观的报道数据,对历史上存在过的“癌症村”进行了一次系统性的回顾。

“癌症村”的历史切片[19]
在‍笔者看来,这些作品最为闪光之处,在于作者对数‍据具有强烈的‍问‍题意识和批判意识。而运用数据来反思和解决社会问题,也将是未来社会治理的必经之路。

6.智能技术变革可视化生产流程

随着智能技术的快速发展,可视化生产流程中的许多工作已可以被机器所替代。

例如,Retrieve-Then-Adapt可以自动生成占比类信息图(如饼图、环图)。用户只需输入一行文本,系统就可以识别出文本中的关键信息、生成信息图设计,并对其布局进行优化。

Retrieve-Then-Adapt: Example-based Automatic Generation for Proportion-related Infographics[20]

Hoffswell等人[21]分析总结了一系列屏幕自适应的规则,如此一来,不同屏幕上的图表就可以方便的迁移。类似地,Wu等人[22]提出了一种基于强化学习的自适应方法,可以将可视化图表自动适配到移动端。
Techniques for Flexible Responsive Visualization Design[21]
此外,在2020年的可视化学术会议中,还有一系列关于智能配色、智能动画、智能交互、智能叙事的研究。例如,Calliope是一个智能的数据故事生成引擎,旨在降低数据故事创作的门槛。用户只需输入一个数据表格,系统就可以自动识别数据中可能的“故事点”,并将其串成一个连贯的故事。

Calliope: Automatic Visual Data Story Generation from a Spreadsheet[23]

智能技术的应用,对于可视化领域的工作者既是挑战、又是机遇。原本重复、机械性的工作将被取代,而创意创新、艺术感性的能力则会被重视。

7.用户需求从观看数据到洞察数据

智能技术的发展和用户需求的提升可以说是相辅相成。当计算机越来越智慧,人对于它的要求也越来越高——单是呈现数据已经不够,用户希望计算机能直接提取出数据中的有用信息,甚至直接帮忙得出结论和解决方案,此所谓“洞察数据”。
根据难易程度,洞察数据可以有三个层次:1.对于某个数据图表的洞见(这个图说明了什么?),2.对于数据集的洞见(这些图共同说明了什么?),3.对于某个领域的洞见(这个领域中存在什么问题?我该怎么办?)
目前,第一个层次已经可以实现:
现有的一些数据分析工具已经可以告诉用户,图表里有哪些地方值得注意
Characterizing Automated Data Insights[24]
然而,要过渡到第三个层次,还十分困难。这不仅要求计算机拥有极强的数据分析能力,还要求它能够模拟人类的思考和行为模式。目前,研究者们仍在理解:人在分析数据的时候是怎么一步步达到洞察的?
He等人[25]发现,人在洞察数据的时候确实存在一些常见的步骤,如不断地进行数据下钻(Drill Down),以达到对某一项数据的深入挖掘。Karer等人[26]发现,洞察数据的过程并不只有纯粹的数据计算,而是包含了大量的“人”的因素,比如人本身的知识、经验等。换句话说,即使是具备很强的数据分析能力,机器想要自动得出人类意义上的“洞察”,依然要攻克很多难题。

8.可视化用于教育和素养提升

大数据时代,数据科学的重要性日益凸显。然而,许多人对于数据望而生畏,导致难以入门。此时,可视化则能担任起“老师”的角色,帮助人们更好地学习数据科学知识。
在下面这个项目中,作者将R语言中常用的数据统计分析方法和公式,绘制成了一幅幅可爱的漫画。使用这样的教材来学习R,是不是有趣很多呢?
stats-illustrations[27]
与这一理念相似,Wang等人为一些较为生僻的图表(如平行坐标系、盒须图等)设计了一套漫画教程(Cheat Sheet),帮助人们更好地学习这类复杂图表。

Cheat Sheets for Visualization Techniques[28]

以上这些实践,展示了可视化与教育学交叉融合的可能性。例如,如何更好地培养儿童的视觉思维能力?如何为抽象知识(如空间几何、物理原理)设计出更好的教材?如何让不具备数据科学知识的人,体验数据学习的乐趣?

畅想未来,阅读数据、理解数据、使用数据的能力,必将成为每个人的基础素养。而信息可视化,则将成为打开庞杂数字世界的一道门、一扇窗。

参考文献:

[1] 来自星星的你——科技工作者心理调查可视化,https://www.bilibili.com/s/video/BV1Gi4y1E75T

[2] 流动的边界,https://www.bilibili.com/video/av753610655/

[3] Masks Work. Really. We’ll Show You How,https://www.nytimes.com/interactive/2020/10/30/science/wear-mask-covid-particles-ul.html

[4] Data Visceralization: Enabling Deeper Understanding of Data Using Virtual Reality,https://arxiv.org/abs/2009.00059

[5] VRIA: A Web-based Framework for Creating Immersive Analytics Experiences,https://github.com/vriajs/vria

[6] Uplift: A Tangible and Immersive Tabletop System for Casual Collaborative Visual Analytics,https://ieeexplore.ieee.org/document/9229116

[7] Scents and Sensibility- Evaluating Information Olfactation,https://dl.acm.org/doi/abs/10.1145/3313831.3376733

[8] The Anatomical Edutainer,https://arxiv.org/abs/2010.09850

[9] DataQuilt- Extracting Visual Elements from Images to Craft Pictorial Visualizations,https://dataquilt.github.io/dataquilt-paper.pdf

[10] Dear Pictograph- Investigating the Role of Personalization and Immersion for Consuming and Enjoying Visualizations,https://dl.acm.org/doi/fullHtml/10.1145/3313831.3376348

[11] Peak map, https://anvaka.github.io/peak-map/

[12] A Bayesian cognition approach for belief updating of correlation judgment through uncertainty,https://arxiv.org/abs/2008.00058

[13] A Design Space of Vision Science Methods for Visualization Research,https://arxiv.org/abs/2009.06855

[14] Data Comics for Reporting Controlled User Studies in Human-Computer Interaction,https://osf.io/unmyj

[15] What Makes a Data-GIF Understandable?,https://data-gifs.github.io

[16] Apache ECharts 5 系列教程(1)动态叙事,https://zhuanlan.zhihu.com/p/348516679

[17] John Burn-Murdoch’s BELIV workshop keynote:,https://youtu.be/xlN_QUdT6os

[18] 2286篇肺炎报道观察:谁在新闻里发声?,http://mp.weixin.qq.com/s?__biz=MzIwMDM5NzYyMQ==&mid=2652455274&idx=1&sn=700e17d6f2b0343d77f1623bc10eaa61&chksm=8d102730ba67ae26ef68789ec0a7565127d9f0daa2840e567b502c39b25e4b0e2533ee0d3045&scene=21#wechat_redirect

[19] “癌症村”的历史切片,http://cancervillage.creatby.com/

[20] Retrieve-Then-Adapt: Example-based Automatic Generation for Proportion-related Infographics,https://arxiv.org/abs/2008.01177

[21] Techniques for Flexible Responsive Visualization Design,https://jhoffswell.github.io/website/resources/papers/2020-ResponsiveVisualization-CHI.pdf

[22] MobileVisFixer: Tailoring Web Visualizations for Mobile Phones Leveraging an Explainable Reinforcement Learning Framework,https://arxiv.org/abs/2008.06678

[23] Calliope: Automatic Visual Data Story Generation from a Spreadsheet,https://calliope.idvxlab.com/

[24] Characterizing Automated Data Insights,https://arxiv.org/abs/2008.13060

[25] Characterizing the Quality of Insight by Interactions: A Case Study,https://ieeexplore.ieee.org/document/9020101/

[26] Insight Beyond Numbers: The Impact of Qualitative Factors on Visual Data Analysis,https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=9241426

[27] stats-illustrations,https://github.com/allisonhorst/stats-illustrations

[28] Cheat Sheets for Visualization Techniques,https://visualizationcheatsheets.github.io/

特别鸣谢:《来自星星的你》作者朱阳阳、《2286篇肺炎报道观察:谁在新闻里发声?》作者葛舒润、《“癌症村”的历史切片》作者赵鹿鸣、祝晓蒙、赵博文与倭瓜分享他们的创作经验 :)

- the end -
(0)

相关推荐