Power BI抓取猫眼数据告诉你,哪部电影更受欢迎?

不知不觉2019年的最后一个假期就要结束了,在这七天长假里,你是怎么安排的,有没有抽空去看场电影?

《攀登者》《中国机长》《我和我的祖国》三部主旋律题材的影片备受关注,即使是没有去电影院看电影,可能最近朋友圈也被这几部电影刷屏了,今天我尝试着用PowerBI抓取了猫眼的数据,来看看到底哪部更受欢迎?

猫眼专业版实时票房网址:

http://piaofang.maoyan.com/dashboard

该网页结构比较简单,直接在PowerBI中通过web获取数据,就可以轻松提取到当前实时的TOP30电影票房,如下图所示。

抓取的数据稍做整理就可以使用,比如用条形图展示前10名的电影票房,当然前三名就是备受关注的这三部,

国庆期间,《我和我的祖国》票房突破20亿,《中国机长》紧随其后,大约18亿元,另外一部《攀登者》就相对很差,只有7亿多的票房;三部电影的票房累计已经超过45亿元,这些票房是不是也有你的贡献呢?

我们再来看看这几部电影的票房走势,需要抓取每天的电影票房数据,在猫眼中可以找到每一天的票房,比如国庆节当天票房数据,网址为:

http://piaofang.maoyan.com/dashboard?date=2019-10-01

仔细分析并测试这个网址,可以发现最后的几个字符就是当日数据的控制参数,想要获取哪天的数据,修改这个日期参数就可以了。

我们可以先获取10月1日的票房数据,并进行整理,然后右键单击该表,利用该查询"创建函数",

把网址最后的日期参数化,实际上是制作一个自定义函数,我们将该自定义函数命名为"每日票房"。

然后添加空查询并利用List.Dates函数生成一个日期序列,因为这几部电影都是9月30日开始上映的,所以生成从9月30日开始的一周序列,

对这个日期列表添加自定义列,调取"每日票房"这个函数,就可以自动获取每天的票房数据了,

这里只是抓取了七天数据,其实你想获取一年的数据,也是同样的方式快速抓取。

对这个数据稍作整理,我们只分析这三部主旋律电影的数据,制作折线图看看票房走势,

从走势图可以看出,《我和我的祖国》国庆节当天票房最高,接近4亿,随后逐渐下降;而《中国机长》到10月2日票房达到峰值,随后开始下降,但下降幅度较为平缓。

并且从10月5日开始,《中国机长》的当日票房已经超过《我和我的祖国》,预计随后的这些天,也都会延续这个趋势,所以《中国机长》的总票房有望超过《我和我的祖国》,是今年非常值得一看的电影哦。

本文电影票房报告web地址,可以复制到浏览器中在线查看:

https://dwz.cn/Adhk30QV

你也可以尝试着用这个网站练习一下,关于PowerBI抓取网页数据的更多介绍,请参考:

如何用PowerBI批量爬取网页数据?

利用API,轻松获取任意地点的经纬度等详细信息

数据分析实战案例,帮你全面认识 Power BI


(0)

相关推荐

  • 用python“科学”预测下《哪吒》票房

    最近几天,朋友圈和微博被<哪吒之魔童降世>刷屏了.不少看过的朋友都成为"自来水",力荐此片. 而它的市场表现也很给力,上映首日即破亿,5天超10亿,目前已成为国产动画片 ...

  • 国庆档三强变双巨头,暂时落后的《中国机长》还会逆袭吗?

    好快好快,还有不到一周的时间就是国庆节了,相信这会童鞋们都已经计划好了自己的长假要怎么过,而这其中,去电影院看场电影是个不错的选择,而且从预售票房来看,已经有很多观众都订好票了! 虽然9月30日还是工 ...

  • 史上最“红”国庆档:3部电影,半个娱乐圈参演,首映已超5亿元

    <我和我的祖国> <中国机长> <攀登者> 3部主旋律大电影,集合9大名导,65名知名演员,5家上市公司同台PK. --今年国庆档很"红". 三 ...

  • 《我和我的祖国》首日登顶,最先掉队的会是《攀登者》?

    一直在感慨时间过得很快,而事实也确实如此,一转眼2019年已经过了四分之三,想想好像暑期档电影还在热映,转眼国庆档电影已经正式上映了,而且首日成绩也已出炉. 其中,由陈凯歌.张一白.管虎.薛晓路.徐峥 ...

  • 被疫情反复“捉弄”的电影院,暑期档凉凉?

    电影院正在被疫情反复捉弄. 昨天,一位好朋友在"相亲相爱一家人"群里发了一张选座购票的截图,问到:去不去看<怒火重案>呢?最后在众人"能不出门就不出门&quo ...

  • 如何用Power Query抓取POST请求类网页数据?

    这篇文章我不建议你收藏,因为你不会打开收藏夹.我建议你现在花上5分钟读完这篇文章,用这5分钟,真正掌握一个知识点. 最近才发现,原来抓取BDI和BHSI指数的网站2021年以后没有更新了: 没办法,只 ...

  • Power Query抓取各省高考分数线的方法

    网址分析的过程之前讲过好多遍了,就不罗嗦了,我们来看分析的结果: 有三个变量, 页面:基本上只有一页,青海是两页 省区代码:比较乱,没有什么规律 年份:提供2014-2019数据查询 先随意抓取一页: ...

  • 如何零编程抓取网页数据

    市面上有很多的爬虫软件,如今有很多的爬虫软件,在我尝试之后,我觉得八爪鱼采集器是比较简单的对于我来说, 我给大家操作下 1.首先下载安装 2.安装好后,打开软件,新建任务(填写任务名称 然后下一步) ...

  • Power BI财务报表分析:数据准备篇

    PowerBI财务报表分析系列之: 数据准备篇 数据分析第一步,需要有数据,然后才能开始后续的一系列分析过程,PowerBI财务报表分析也不例外,第一篇,先来介绍报表数据的获取,以及将获取的数据整理成 ...

  • Power BI财务报表分析:数据建模篇

    PowerBI财务报表分析系列之: 数据建模篇 我们面对的源数据,往往并不是只有一张表,而这些不同的表,需要协同配合才能更有效的使用,多表的协同配合依靠表与表之间的逻辑关系. 根据分析的需求,在多个表 ...

  • 这款软件爬虫非法抓取微博数据,赔了一千多万

    不知道有没有人听过一款软件叫做超级星饭团,如果身边没有追星的狂热粉丝,可能对这款app不是很了解.这是一个"专属爱豆应援的追星神器".其实除了这个软件还有许多其他类似的. 饭圈AP ...

  • Python爬虫入门,快速抓取大规模数据(第二部分)

    通过第一部分的练习,我们已经有了一个可运行的爬虫.这一部分我们详细的看看如何使用BeautifulSoup从网页中提取我们需要的数据,学习的目标是能够使用BeautifulSoup从网页中提取任意的数 ...

  • Python爬虫入门,快速抓取大规模数据

    大到各类搜索引擎,小到日常数据采集,都离不开网络爬虫.爬虫的基本原理很简单,遍历网络中网页,抓取感兴趣的数据内容.这篇文章会从零开始介绍如何编写一个网络爬虫抓取数据,然后会一步步逐渐完善爬虫的抓取功能 ...