爬取周杰伦新歌《说好不哭》的所有评论，然后生成词云图

2024-06-18 02:57:59

前两天

周杰伦发了新歌

说好不哭

顿时间就刷屏了

周杰伦

是一个时代的符号

是我们的青春

早些天

小帅b听周杰伦的歌

还湿润了眼眶了呢

那时候我们唱 k

周董的歌是必点的

他的电影

《不能说的秘密》

就刷了好几遍

这次的新歌

MV 很 nice 啊

特别是里面的女主

上网搜了一下她的照片

小帅b瞬间就爱了啊

刚看了下qq音乐的评论

2500+ 的评论

小帅b不禁好奇

这些评论

都在说写什么呢

要不然就把它们爬下来

搞个词云图看看吧

接下来就是

学习 python 的正确姿势

首先我们来分析一下这个网页

打开控制面板

我们点击下一页

发起请求

发现了一个 comment 的请求

点击进去

咦～

这不就是评论的数据嘛

再具体看下 json 数据

原来评论的数据是被

封装到 comment 对象下的

commentlist 数组了

再来看看是怎么请求的吧

点击 Headers

哇靠

请求链接这么长

看看请求参数

看来看去

主要就 pagenum 和 lasthostcommentid 在变

pagenum 一看就是页码

请求第一页的 pagenum 是 0

第二页是 1

lasthostcommentid 则是

上一页请求的最后一条评论id

用 Python 来模拟请求一下吧

前方高能

这么多请求参数

我可不想一个键值一个键值的

复制粘贴

复制一下 cURL

然后打开我之前说的

点击 Import 按钮

接着选择

Past Raw Text

然后

把刚刚复制的 cURL 粘贴进去

点击 Import

点击 Send

可以看到

评论数据返回了

接下来骚操作了

点击 Code

此时会出现一个面板

选择

Python Requests

直接一键生成

Python请求代码

太太太太TM爽了

有了这么方便的请求代码

爬取数据到 txt 文件不是

so easy 么

简单撸下代码

把评论数据都爬下来

先直接把刚才生成的请求代码

复制过来

创建一个文件用来存放评论数据

来个 for 循环请求每一页的数据

在每一次请求的时候

还要拿到最后一条评论的 id

作为下次请求的参数

我们知道

评论数据被封装在 json 数组里面

所以可以循环获取一下

然后写到文件里面去

不过有些评论数据含有表情啥的

需要把它们顺便给替换掉

写完之后把文件给关了

跑一下吧

完事之后

jay.txt 就有所有的评论了

有了数据之后

咱们就可以生成词云了

准备个字体文件

准备张背景颜色图片

打开

因为中文

结巴分词整起

接着就可以使用

wordcloud 搞事情了

最后我们使用

pyplot 来 show 一下吧

运行一波

词云出来

可以看到

说好不哭和假面骑士

出现的频率最高

假面骑士说得是 mv 里的男主

其中的“自己”、“努力”、“人生”

也是能量满满

小帅b

谨以此篇

致敬周杰伦

以及我们的青春

下回见

peace

扫一扫

学习 Python 没烦恼

赞 (0)

方文山两次发博力挺周杰伦，情商这么高难怪词写得那么好！

这个5月,许多熟悉的歌手都不约而同的发新歌了,其中最火的当属周杰伦的<不爱我就拉倒>! 讲真,周董的新歌火并不是什么新鲜事,不过这次火得比较特别,因为歌词太过直白,不少听众觉得" ...
歌迷调侃周杰伦土味歌词去找方文山，他却用歌名回应不爱我就拉倒

本文由明星粉丝团作者芦笙原创,未经允许不得转载我们都说周杰伦是我们的青春,曾经的很长一段时间在很多人的心目中他的位置是不可撼动的.以至于在周杰伦结婚的时候,昆凌的微博评论里都是照顾好我们的青春啊.对 ...
林俊杰新歌《将故事写成我们》上线，跟《说好不哭》相比如何？

不知道是巧合还是缘分,周杰伦的新歌<说好不哭>才上线几天,就迎来了林俊杰的新歌<将故事写成我们>上场,我想对于既喜欢周杰伦,又喜欢林俊杰的歌迷来说,没有比这更幸福的事了! 不过 ...
泡脚音乐第65期：适合在秋天一个人听的9首歌

适合秋天一个人听的9首歌 1.陈绮贞 <我喜欢上你时的内心活动> 推荐词:是啊,终于等到九月,陈老师一把年纪,少女感依旧,与十几年前别无二致,引人恍惚.她的声音也一点没变,还是那个白裙飘飘 ...
周董新歌“说好不哭”，描绘了一个女人最傻的样子

周董的夕阳红粉丝,纷纷在9月16日的晚间11点,守在荧幕前. 为的就是要第一时间听周董的新歌"说好不哭",甚至因为太多人同时在线,而瘫痪了QQ音乐. 很多人都在这首歌找回了青春.但 ...
周杰伦新歌《说好不哭》如期上线，如果10分是满分你会给多少？

歌手发新歌不是什么新鲜事,不过一位歌手发新歌,能发出一种"过节"的即视感,我想也就周杰伦能做到了,一方面是出道多年积攒下的人气,歌迷很多,路人粉更多,如果想冲个超话随随便便就拿个第 ...
周杰伦新歌《说好不哭》：用青花瓷的旧碗，盛出变味的鸡汤

他来了,他来了,他带着新歌走来了! 新单曲<说好不哭>上线6分钟,销售额就达到500万元:上线100分钟,突破1000万元:一天时间,突破1900万元,成为QQ音乐平台历史销售额最高的数字 ...
周杰伦新歌《说好不哭》MV，看完我哭了

你好九月 9月18日 2019 星期三没有了联络后来的生活我都是听别人说说你怎么了说你怎么过放不下的人是我周杰伦发新歌了!你们的青春记忆又回来了.9月16日深夜23点,周董的新歌< ...
周杰伦新歌《说好不哭》：让QQ音乐哭了

文/如海昨晚11点,周杰伦的新歌<说好不哭>上线,不到两小时,单曲销售总额突破一千万. <说好不哭>三块钱一首,周杰伦静静的坐在黑夜里,听着支付宝美美的滋滋声:"三 ...
周杰伦新歌《说好不哭》，粉丝却哭了，谁的青春没有一首周杰伦

今日,官方消息证实,周杰伦的新歌<说好不哭>将于9月16日发表,歌迷纷纷感慨有生之年系列,几年没出新歌的杰伦终于要出歌了,之前嫂子昆凌也曾在线催歌,看来等的着急的不仅是歌迷啊. 前段时间全 ...
周杰伦新歌《说好不哭》要怎样缴纳个人所得税

想算清所得税可真难啊! 9月16日,周杰伦一曲新歌<说好不哭>上线,引得无数粉丝熬夜狂欢.新歌上线100分钟,销量达成"双钻石唱片"认证:上线两小时,单曲数字版销售总 ...
周杰伦新歌《说好不哭》刷爆朋友圈：孩子哭闹时，家长该如何应对？

要说这几天哪一首歌最火,肯定首推周杰伦的<说好不哭>. 取自微博要知道,距离周董上一首<不爱我就拉倒>,已经是一年零四个月之前的事情了:距离上一张专辑<周杰伦的床边故事 ...
周杰伦新歌《说好不哭》：你的青春，用力爱过吗？

周杰伦新歌<说好不哭> 你的青春,用力爱过吗? 作者:绿萝轻挽图片:网络周杰伦〈说好不哭〉Mv 9月16日晚23点,方文山作词,五月天阿信伴唱,周杰伦的新专辑<说好不哭>正 ...