Power Pivot里的空文本怎么来的?怎么处理?日期也转换不了,怎么办?
前面,我们在文章《PP-数据建模:明明删除了重复项,为什么还是说有重复值?》里提到,文本后面的空格,在添加到Power Pivot数据模型时会被删除,不过,在当时的案例里,没有暴露出来另一个问题:
假如说,这个文本里就只有空格(1个或多个),添加到Power Pivot数据模型时,空格会被删掉,问题是,删掉空格后的内容,到底是一个空值(blank)呢?还是一个空的文本("")?
我们来试一下,比如说这列日期数据里A3有个空格,A5是啥都没有的空单元格:
添加到数据模型后,加个函数判断一下:
显然,空格的内容仍然是文本,但空单元格却不是文本,而是空值(blank),如下:
那么,这种只有空格的内容是不是没有被删掉?再求一下长度试试:
所以,空格是被删掉了,但仍然是一个长度为0的空文本,而原来是空内容的单元格,内容是“真”空!
好,前面说了这么多,跟实际工作中的数据处理有毛线关系?
——显然这列日期没有被转换为日期,那转换为“日期”格式试试?
这个出错信息还挺具体,值""类型不匹配!
那么,如果要在Power Pivot里完成这列数据的规范化,怎么办?
——加个判断吧,如果是空的文本,就用blank()代替,然后再转换为“日期”类型:
烦吗?
对的,真的很烦!
但是,如果源数据不规范,在后续的数据处理过程中就是会很烦的。另外,对于空文本、空值等问题,在任何软件、工具的处理过程中,也都是要专门注意的问题,而且处理规则不太一样——这一点,我在Power Query的文章《【视频】学了方法,有了思路,问题再多也不怕——附空值(null)多种处理讲解视频》也提到。
所以,关键的关键,还是要学会找原因、找规则、找方法,而这些,都在于一些基础知识的熟练运用。
在线M函数快查及系列文章链接(建议复制到浏览器中打开后收藏使用):
https://app.powerbi.com/view?r=eyJrIjoiZDVhZDBlMTYtNDkzNC00YWFjLWFhMmMtMmI3NTk2Y2ZhMzc3IiwidCI6ImUxMTAyMjkxLTNkYzUtNDA1OC1iMDc3LWQ0YzU4YWJkMWRkOCIsImMiOjEwfQ%3D%3D
注意,因为公众号文章是不能直接通过点击的方式跳转到外部链接的,所以需要大家动手复制到浏览器中打开。