【数据分析过程解析】三、分析和展现数据

前面我们介绍了Excel中的Power BI组件,也介绍了实际工作中使用这些组件的一些案例。但还有些朋友对Power BI不太熟悉。从今天开始,我们将用一系列(3-4篇)文章完整介绍一个使用Power BI进行数据分析的全过程。

今天是第三篇:分析和展现数据

为了减少麻烦,本系列用的文件是微软提供的几个数据文件。

数据源文件获得方式:

关注本公众号,回复“Power BI数据分析案例文件”即可获得下载地址

正文

前面我们介绍了如何整合数据并创建数据模型,以及如何扩展和丰富数据模型,这里是链接:

整合数据并创建数据模型

扩展和丰富数据模型

今天我们介绍如何使用Power View制作数据分析报告。

0. 准备

其实我们的准备工作都已经做好了。数据已经整合完成,数据模型已经建立。如果你学习过前面的内容,Power View已经激活。(如果没有激活的话,看这里

但是微软的系统就会有小插曲。你可以先跳过下面的内容,直接去看1. 插入Power View报告这一部分。如果你可以成功插入报告。就不用看这一部分内容了。否则,下面就是解决方案。

有时,在你插入报告时,会弹出这样的对话框:

点击确定后,去微软网站下载一个注册表项程序包,地址为:

https://gallery.technet.microsoft.com/scriptcenter/Registry-keys-to-reenable-7cd9f723

进入后是这个样子的:

下载后解压,进入目录,找到文件:

双击即可完成注册。会弹出警告信息:

选择“是”即可。完成后,重新启动Excel。

1. 插入Power View报告

在“插入”选项卡下,点击“Power View”:

Excel中插入了一个工作表,叫做“Power View1”,里面是个空白报告:

在右侧“Power View Fields”中,选择Hosts表,然后勾选City。然后选择Medals表,勾选Sport。在报告区域,显示如下:

在点击右侧“FIELDS”中的Sport后面的箭头,选择“Count(Not Blank)”:

可以看到,左侧的Sports已经变成了数字。

鼠标点选报告区域中的任意单元格,会出现“设计”选项卡,选择“切换可视化效果”组中的地图:

在“Power View Fields”中Medals表中,将Sport字段推拽到COLOR下面的框中:

可以看到,在地图的显示上增加了颜色(夏季用蓝色,冬季用红色)。在地图旁边出现了图例。与Excel图表的图例不同,这里的图例可以点击,地图上会根据选择发生变化:

这里的地图不同于Power Map(关于Power Map见这里),感觉更像是Bing Map(关于Excel中使用Bing Map,见这里

2. 添加计算字段

如果我们想要分析和展示的内容在数据模型中没有,我们可以在数据模型中创建计算字段。

点击“Power Pivot”选项卡下的“管理”,管理数据模型:

选择Medals表,点击“主页”选项卡下的“计算区域”,在表格下方将显示计算区域:

选中计算区域中Edition列下面的第一个单元格,点击“主页”选项卡下的“自动汇总”后面的箭头,点击“非重复计数”:

实际上,这就是我们前一节提到过的DAX函数,Power  Pivot利用DAX函数创建了一个公式(在公式编辑栏中可见):

Edition 的非重复计数:=DISTINCTCOUNT([Edition])

关闭“Power Pivot for Excel”窗口,保存Excel文件,回到Power View工作表。这时,会出现以下信息框:

提示你数据模型已经修改。点击OK,Power View将会被更新。

再次回到管理数据模型的窗口,在Medals表的计算区域中,选中刚才添加计算字段的单元格下方的单元格:

在公式编辑栏中输入公式:

金牌百分比:=[以下项目的计数:Medal]/CALCULATE([以下项目的计数:Medal],all(Medals))

为了测试一下这个计算字段,我们关闭“Power Pivot for Excel”窗口,利用这个计算字段实现如下的透视表:

3. 设置默认字段集,表行为和数据类别

为了简化创建报告的工作,我们可以设置默认字段集。

回到管理数据模型窗口,选择Medals表,在“主页”选项卡下,选择“数据视图”。

点击“高级”选项卡,点击“默认字段集”:

在出现的窗口中,在左侧选择Sport, Medal, Event,EditionID,Athlete(按Shift/Ctrl键点击鼠标,可以多选),然后点击添加,将这些字段添加到默认字段集中:

点击“确定”,默认字段集添加成功。

我们回到Power View中看看默认字段集的效果:

在Power View左侧的报告区域点击空白的地方,然后在右边“Power View Fields”中点击Medals,在左侧报告区域就会显示默认字段集的报表:

这个功能其实很有用。因为你表中的字段可能很多,但是我们在分析和展现时可能只用其中的某几个字段。(甚至在做多份报告时也是如此)。这个设置就可以我们创建报告的效率得到很大提升。而且,我们还可以设置表行为,让默认字段的呈现效果也自动设置。

回到“Power Pivot for Excel”窗口,在“高级”选项卡下点击“表行为”:

在表行为对话框中,首先设置行标识符。行标识符是表中的某一列,这一列必须能够唯一标识该行。我们选择MedalKey作为行标识符。

在保持唯一行中,选择AthleteID列。被选择的这列在透视表和Power View中不会被合并。

将默认标签选择为Sport。

将默认图像处保持为默认值([未选择任何列])

点击确定。返回Power View工作表,选择我们添加的Medals报告(在地图下方的数据报表)。在“设计”选项卡下,依次点击“表”,“卡”:

你的报表变成了下面的样子:

拖动卡片右侧的滚动条,你可以看到数据变化。

为了更好地让Power View基于数据模型动态创建报告,Power View必须能够尽可能识别这些字段的内容,例如表示位置信息的字段,我们可以在数据模型中手工为这些字段设置分类。

在Power Pivot for Excel窗口中,选择Hosts表。选择NOC_CountryRegion列,然后在“高级”选项卡下,点击“数据类别”后面的箭头,选择“国家/地区”:

在Medals表中也有相同的一列,重复同样的操作,将该列分类为国家/地区。

回到Power View工作表中,在右侧“Power View Fields”的字段列表,可以看到在NOC_CountryRegion字段前面出现了一个地球的图标,表示Excel已经将这一列识别为位置信息了。

这些信息在将来的分析中都会被用到。

4. 总结

对于制作交互式的数据报告或者Dashboard来说,Power View是一个非常好用的工具。里面内置了各种数据和图表的展示方式,利用它我们可以做出任何想要的数据报告。

Power View的基础还是数据模型,实际上,你可以将它理解为加强版的透视图(还是多个透视图的集成)。并且为了形成报告,Excel还做了很多增强。比如通过默认字段集,表行为等提高工作效率。

今天就到这里了。

取得本文案例文件的方式:

  1. 关注本公众号

  2. 回复“Power BI数据分析案例文件”即可获得下载地址

(0)

相关推荐