公式来了!PQ里的列表排序函数超级好用!
昨天,在文章《将内容按字符出现次数排列?这个在Excel里的难题因为PQ而轻松解决!》,通过多个步骤的操作,实现了相应的排序效果,但是,原文中的操作方法也存在一个bug:
即在有相同内容的情况下,最后通过对内容的分组合并,会导致多个内容合并到一起,因此,应改为按索引分组合并。
非常感谢“四十而惑”的提醒!
此外,昨天提到,这个问题如果通过M函数来解决,其实也非常简单,同时,借这个例子稍为深入了解一下Power Query里的列表排序函数——List.Sort!
先上公式:
思路(由内而外逐层理解):
1、将数字内容拆分为列表(Text.ToList)并去重(List.Distinct)
2、对去重后的列表按照数字内容通过替换的方式剔除该字符(Text.Replace)后的长度(Text.Length)进行排序(List.Sort)
3、将排好序的内容合并(Text.Combine)
其中比较关键的地方在于第2点,List.Sort函数,可以根据自定义函数进行排序,而不限定于根据列表的内容本身进行排序——类似于Power Pivot中的按列(参照)排序。
比如这里,对于去重后的列表中的每一个字符,其在数字内容中的个数越多,以替换的方式剔除后,得到的结果就越短,即长度越小,List.Sort参照这个长度排序,自然就会排在较前的位置。
更具体一点儿,如数字内容“11124533”,拆分并去重后得到的列表为“1,2,4,5,3”,对于这个列表中的每一个字符:
比如1,在整个数字内容中通过替换剔除后,将得到结果24533,即剔除了其中的3个1,剩余内容的长度为5;
对于2,则替换后得到1114533,即剔除了其中的1个2,剩余内容的长度为7……
显然,如果某个字符在数字内容中出现得越多,替换后剩余内容的长度就越短,List.Sort通过参考这个结果,就会将其排在越前面。
因为可以实现参照排序,List.Sort在对列内容的排序时非常灵活。实际上, List.Sort的第2个参数还有很多种形式,我将在后续的文章中继续与大家分享。