根据微软Power BI排期,原本只能在SSAS 2019中使用的DAX特性–CalulationGroup,将在今年的Desktop中发布。本文将围绕CalulationGroup,言简意赅的讲解它的概念,以及它在PBI报表中具体是如何被应用的,能为我们带来什么。
近期国内疫情严重,宅在家里,工作要做,游戏要玩,但对BI技术的探索也不能少。偶然想起半年前Macro Russo大师曾发表数篇关于CalulationGroup的介绍性文章,但当时本人除了Power BI以外,SSAS也只装了2012和2017两个版本,不便亲自实践,只能在理论意义上理解CalulationGroup,现在有空折腾了,就在个人电脑中又装了一个SQLServer 2019,以SSAS表格模型作为后端,PowerBI作为前端来实际体验了一下CalulationGroup。关于CalulationGroup,中文译为“计算组",也称”度量值组",在Macro的此篇文章中有很好的介绍,推荐阅读:https://www.sqlbi.com/articles/introducing-calculation-groups/
CalulationGroup是一个表,这意味着它同样可以在DAX公式中被引用;它包含一列或两列,第一列即实际意义上的"度量值组",列中的值由多个度量值组成;第二列为可选列,用于对度量值组进行排序。
度量值组中的值,即度量值本身被称为CalulationItem(计算项),它本身代表的是一个上下文环境。SELECTEDMEASURE()函数接受度量值作为参数,在特定计算项的上下文环境中执行计算。
计算项默认对所有度量值有效,但你可以使用ISSELECTEDMEASURE()或SELECTEDMEASURENAME()对计算项的应用范围做出限制,使之仅对特定度量值有效。
允许创建多个度量值组,但必须设定优先级,以使引擎能够理解特定度量值在不同度量值组之下的计算项上下文环境中的计算顺序(如X+1和X * 2, 是先加1还是先乘2,需要设置清楚)。在SSAS中,优先级参数为Precedence, 该值越大,优先级越高。
同一个度量值组中,只能有一个计算项被激活,这是可以理解的,因为在同一个度量值组中,不同计算项不存在优先级关系,一旦多个计算项被同时应用,引擎无法理解哪个计算项被优先应用。
此外,还有一个名为SELECTEDMEASUREFORMATSTRING()的函数,它代表当前度量值的格式字符串,我们暂时无法了解未来CalulationGroup在Power BI中是如何使用的,但在SSAS中,你可以为每个计算项使用DAX表达式来设定其格式字符串。首先介绍本文使用微软官方提供的AdventureWork2017作为数据源进行建模,主要表格关系如下示:接下来,在应用场景之下,你可能会想,CalulationGroup最主要的作用是什么?事实上它大幅减轻了DAX代码维护成本,在越复杂的报表项目中,可能涉及到要建立许多个度量值时,这种作用的优势越明显。此外,它还增强了对数据格式控制的灵活性。在下文中,我将使用CalulationGroup为Power BI报表实现三种效果,这些效果不仅是在应用中经常需要实现的,还可以很好的表现其优势:1. 建立多个度量值,其中包括销量,销售额,税后销售额,成本及利润,并为每个度量值计算其上月值,上月环比,去年当月值,去年同比以及度量值本身的值。2. 实现数据可以依据不同的日期字段进行切换:根据订单日期,根据发货日期以及根据截止日期3. 实现汇率转换,同时需要依据不同的货币切换货币符号,以人民币,美元及欧元为例1. 建立多个度量值,其中包括销量,销售额,税后销售额,成本及利润,并为每个度量值计算其上月值,上月环比,去年当月值,去年同比以及度量值本身的值。通常情况下,实现此效果需要建立(5*5)共25个度量值!或者需要利用计算表及SWITCH()编写较为冗长的代码,十分不便,利用CalulationGroup,你只需要设定销量,销售额,税后销售额,成本及利润这五个基础度量值就足够了,然后创建一个CalulationGroup,分别代表不同的计算方式,即可实现此效果。在本例中,此CalulationGroup的表达式为:IF(ISBLANK(SELECTEDMEASURE()),0,SELECTEDMEASURE ())---------------------------------------------------------------DATEADD('DimDate'[FullDateAlternateKey],-1,MONTH)),IF(ISBLANK(LAST_MONTH),0,LAST_MONTH)---------------------------------------------------------------VARTHIS_MONTH = SELECTEDMEASURE(),DATEADD('DimDate'[FullDateAlternateKey],-1,MONTH)BLANK(),DIVIDE(THIS_MONTH,LAST_MONTH)-1---------------------------------------------------------------DATEADD('DimDate'[FullDateAlternateKey],-1,YEAR))IF(ISBLANK(LAST_YEAR),0,LAST_YEAR)---------------------------------------------------------------VARTHIS_YEAR = SELECTEDMEASURE()DATEADD('DimDate'[FullDateAlternateKey],-1,YEAR)ISBLANK(LAST_YEAR),BLANK(),DIVIDE(THIS_YEAR,LAST_YEAR)-1所有基础度量值会在以上任一被选中的计算项中执行计算,比如选择SPLY(上年同月)计算销量,则执行以下计算:FactInternetSales[Sales Qty],DATEADD('DimDate'[FullDateAlternateKey],-1,YEAR))IF(ISBLANK(LAST_YEAR),0,LAST_YEAR)可以发现一个问题,即计算项并未按照我在度量值组中所设定的顺序显示,这时就需要设定CalulationGroup中第二列的值,即ordinal参数,该参数的设定在使用Visual Studio 2019开发环境中的SSAS中不可见,因此需要在源代码中补上这一参数(相信未来在Power BI中关于CalulationGroup的设定能够更加友好),效果如下:2.实现数据可以依据不同的日期字段进行切换:根据订单日期,根据发货日期以及根据截止日期实现此需求,自然需要用到USERALATIONSHIP(),同理,实现此效果需要新建一个CalulationGroup,注意,此时已经存在超过一个CalulationGroup了,因此必须指定好它的优先级。表达式如下:---------------------------------------------------------------USERELATIONSHIP(FactInternetSales[ShipDate],DimDate[FullDateAlternateKey]))---------------------------------------------------------------USERELATIONSHIP(FactInternetSales[DueDate],DimDate[FullDateAlternateKey]))3.实现汇率转换,同时需要依据不同的货币切换货币符号,以人民币,美元及欧元为例此处的难点首先在于转换汇率时,度量值组如何忽略对非金额数据的影响,如本例中的Sales Qty,这一点可以使用前文提到的ISSELECTEDMEASURE()解决,其次在CalulationGroup 1中,MOM和YOY是百分比值,由于度量值组中所设定的格式字符串会覆盖度量值本身的格式,因此设定货币符号的格式字符串同时也会影响到MOM和YOY,因此必须要找到办法能够判断哪些计算项需要货币符号,哪些不需要。事实上,如前文所述,CalulationGroup是一个表,因此结合SELETEDVALUE()函数即可解决问题,DAX表达式如下:
CalulationGroup3:
--注:数据源中的汇率表以美元作为本位币
RMB :=
IF (
NOT ISSELECTEDMEASURE ( [Sales Qty] ),
DIVIDE (
SELECTEDMEASURE () *[Avg_CurrencyRate],
CALCULATE (
MAX ( FactCurrencyRate[AverageRate]),
FILTER ( 'FactCurrencyRate','FactCurrencyRate'[CurrencyKey] = 103 )
)
),
SELECTEDMEASURE ()
)
---------------------------------------------------------------
EURO:=
IF (
NOT ISSELECTEDMEASURE ( [Sales Qty] ),
DIVIDE (
SELECTEDMEASURE () *[Avg_CurrencyRate],
CALCULATE (
MAX ( FactCurrencyRate[AverageRate]),
FILTER ( 'FactCurrencyRate','FactCurrencyRate'[CurrencyKey] = 36 )
)
),
SELECTEDMEASURE ()
)
---------------------------------------------------------------
USD:=
IF(
NOT ISSELECTEDMEASURE([Sales Qty]),
SELECTEDMEASURE()*[Avg_CurrencyRate],SELECTEDMEASURE()
)
CalulationGroup 3 (FormatString表达式):--注:报表所有金额基础度量值默认格式为货币(人民币)SELECTEDMEASUREFORMATSTRING()---------------------------------------------------------------IF(ISSELECTEDMEASURE([Sales Qty]),SELECTEDMEASUREFORMATSTRING(),NOT OR(SELECTEDVALUE('CalculationGroup 1'[CalculationItemColumn 1]) ="MOM",SELECTEDVALUE('CalculationGroup 1'[CalculationItemColumn 1]) ="YOY"),SELECTEDMEASUREFORMATSTRING()---------------------------------------------------------------IF(ISSELECTEDMEASURE([Sales Qty]),SELECTEDMEASUREFORMATSTRING(),NOT OR(SELECTEDVALUE('CalculationGroup 1'[CalculationItemColumn 1]) ="MOM",SELECTEDVALUE('CalculationGroup 1'[CalculationItemColumn 1]) ="YOY"),SELECTEDMEASUREFORMATSTRING()至此,我们即可实现所有效果,但事情到此尚未结束,在下图中你会发现在计算销售额的MOM和YOY时出现计算错误:之前所设定的公式都是没有问题的,但为何会出现错误呢?原因是在计算环比和同比时,所基于的数据是本币数据,而非转换为人民币,美元或者欧元后的数值,因此罪魁祸首是对CalulationGroup的优先级的错误设定。我们需要让数据先转换为指定货币,然后再执行计算。因此这里需要将CalulationGroup 3的优先级设为最低,CalulationGroup 2其次。如下图所示,数据得到完美的纠正:利用CalulationGroup,原本需要建立上百个度量值(5 * 5 * 3 * 3)的需求,成功简化为几个基础度量值和三个度量值组,大幅节约了报表开发的时间成本以及后期代码的维护成本;同时,利用格式字符串表达式可以实现报表更灵活更定制化的显示效果。此外,如果你有关于CalulationGroup其他的典型应用案例欢迎留言分享。