好不容易网抓下来个数据,怎么长这样?
上次的文章《如何用Power Query抓取POST请求类网页数据?》里我们用从网站上抓取了到了一个json格式的数据:
但有朋友说,这个数据怎么长这样啊?好像还没有网页上显示的日期啊,怎么整理呢?
仔细分析,其实对这个列表的整理主要涉及以下两个关键内容:
1、这个列表中的列表怎么转换为想要的规范的表?
这个问题其实不难,如果看过我前面分享过的文章《你错过了一个彩蛋 | 除了有趣又有用的List.Zip拉链函数,还有个更强大牛掰的配对函数!》,那应该还能想到多种方法,这里用其中最简单的再演示一遍:
1.1 直接点击展开列表数据
1.2 用函数Table.FromRows将列表转换为表:
2、但是这里面的时间怎么不是日期啊?到底是啥?
这个问题其实在以前的文章里也有提到过,如果关注我的公众号,并且看过《网抓没取到最新数据?很可能是少了这个参数!》这篇文章的话,应该能想到,这是一个时间戳,或者说,如果你发现一个本来应该是日期或时间的数据是一长串数字,那你基本可以猜,这就是一个时间戳。
不过,这个时间戳有一点点特殊:比正常的时间戳更长一点儿——放大了1000倍!一般的时间戳精确到秒,这个精确到了毫秒!——而在PQ里,#duration(时长)只支持到秒,所以后面我们要将该时间戳缩小1000倍。
——无聊啊!需要这么精确吗?这个数据其实只是要精确到天!
知道了这个,处理起来也好办了:在PQ里,要将时间戳转换为日期,只需要用时点1970年1月1日0时0分0秒加上时间戳所表示的秒数即可,用当前这个问题演示如下:
2.1 为了方便改公式(我一向主张《PQ M语言代码不是写出来的,是改出来的——写在M开篇之前》),我们直接先通过“除”操作的方式将时间戳缩小1000倍
2.2 直接修改步骤公式实现时间的转换
至此,数据全部整理完毕。
实际上,对于大家在使用PQ或PP过程中所遇到的大多数问题,我前期的文章或视频里都有讲到,所以,很多时候,答疑就变成了这样:
所以,再次跟大家说一下,通过公众号的文章、书和视频(记得做好笔记)打好基础,或者起码对这些知识点有印象,以及学会使用搜索,真的很关键!
关于公众号文章的搜索方法,请参考文章《【重要技巧】公众号配套资料的下载、文章的搜索及阅读》
关于视频内容的搜索,如果你自己没做好笔记,我也给你整理了一个Excel表,请参考文章《70+篇PQ/PP/PBI文章视频,除了链接,竟然还有内容要点!》下载使用(已购买视频的朋友在视频群中可直接下载。)
【近期热门合集/文章】