Python抓取B站评论词云可视化（一看就会）

2024-06-17 18:23:30

前言

大家好，我是南南

众所周知，作为一个单身lsp，b站舞蹈区探花，咳咳咳，直接进入正题吧

由于内容过多，爬虫代码csdn上有很多篇博客讲解，我就不写了（我是不会告诉你是我懒的）

视频地址:BV12q4y1S7j9

爬完的数据是一个xlsx文件点我下载，我们直接开始数据分析吧！

提取评论写入txt文档

# -*- coding:utf-8 -*-import refrom openpyxl import load_workbook#打开一个新文件wb = load_workbook(filename = r"C:\Users\Administrator\Desktop\ss.xlsx")data = open("b.txt",'w',encoding="utf-8")#建立文档ws.delete_rows(1)#删除第一行\ws = wb.get_sheet_by_name('sheet1')#打开工作表1first_column = ws['D']#第四列for i in range(len(first_column)): print(first_column[i].value,file=data) #读取单元格内容并存储为文本

导入相关库

#!/usr/bin/python# encoding: UTF-8import reimport jiebaimport wordcloudimport pyecharts.options as optsimport pandas as pd

文本转列表

result=[]with open('b.txt', encoding='utf-8') as f: for line in f: result.append(line.strip('\n').split(',')[0])print(result)#下面是对读取到的数组进行变化result_gai = []a = 0for i in result: while(a%2 == 0): pos = i.find('：') #查找某一个字符在在字符串的位置 result_gai.append(i[pos+1:]) break a+=1print(result_gai)

去除符号

res = ''.join(result_gai).replace('\xa0', '').replace('\ufeff', '').replace('\r', '')print(res)

词云可视化

from wordcloud import WordCloudwordcloud = WordCloud(font_path="msyh.ttc",background_color='white').generate(string)#定义字体和背景色%pylab inlineimport matplotlib.pyplot as pltplt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")

运行结果

写在最后

感觉python还是蛮简单的，有兴趣的可以学一学python基础语法

赞 (0)

实战！用 Python 给母亲送祝福!

来源:Python 技术「ID: pythonall」今天是母亲节,小阿酱在这里祝天下所有的母亲节日快乐,作为女儿的我除了买礼物送惊喜外还要用 Python 送上特殊的祝福! 母亲节(Mother' ...
实战！Python 偷偷告诉你小姐姐的听歌喜好

来源:Python 技术「ID: pythonall」作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷 ...
如何利用“wordcloud+jieba”制作中文词云？

如何利用"wordcloud+jieba"制作中文词云? 词云又叫文字云,它可以统计文本中频率较高的词,并将这些词可视化,让我们可以直观的了解文本中的重点词汇(词的频率越高,词显示 ...
今天来聊聊求职需要的 Python 技能

每年的 3.4 月份都是金三银四跳槽季,企业一般也会选择在这个时期调整职工的薪资,小伙伴在这个时候也会心里痒痒,在招聘网站上看看是否有合适的机会,需要的 Python 技能是否符合年限等等情况.这里以 ...
DayDayUp：寒门女孩考入北大→换角度看待表达《感谢贫穷》—关于吃苦与穷~~~Python之wordcloud词云图可视化

DayDayUp:寒门女孩考入北大→换角度看待表达<感谢贫穷>-关于吃苦与穷~~~Python之wordcloud词云图可视化目录博主看法-关于吃苦与穷大多数人对吃苦的含义,理解的太 ...
Python抓取必应搜索背景图片

本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于编码珠玑 ,作者刘亚曦 Python爬虫.数据分析.网站开发等案例教程视频免费在线观 ...
用 Python 抓取公号文章保存成 PDF

今天为大家介绍如何将自己喜欢的公众号的历史文章转成 PDF 保存到本地.前几天还有朋友再问,能不能帮把某某公众号的文章下载下来,因为他很喜欢这个号的文章,但由于微信上查看历史文章不能排序,一些较早期的 ...
用 Python 抓取公号文章保存成 HTML

上次为大家介绍了如果用 Python 抓取公号文章并保存成 PDF 文件存储到本地.但用这种方式下载的 PDF 只有文字没有图片,所以只适用于没有图片或图片不重要的公众号,那如果我想要图片和文字下载下 ...
Python 抓取知乎几千张小姐姐图片是什么体验？

来源:Python 技术「ID: pythonall」知乎上有许多关于颜值.身材的话题,有些话题的回复数甚至高达几百上千,拥有成千上万的关注者与被浏览数.如果我们在摸鱼的时候欣赏这些话题将花费大量的 ...
Python 抓取网页乱码原因分析

在用 python2 抓取网页的时候,经常会遇到抓下来的内容显示出来是乱码. 发生这种情况的最大可能性就是编码问题:运行环境的字符编码和网页的字符编码不一致. 比如,在 windows 的控制台(gb ...
『爬虫四步走』手把手教你使用Python抓取并存储网页数据！

爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...
「爬虫四步走」手把手教你使用Python抓取并存储网页数据

爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...
利用python抓取页面数据

利用python抓取页面数据
【视频】抓包小练习-B站评论数据抓取

案例 https://bangumi.bilibili.com/anime/6301/play#113081 视频代码 import requests import json #获取oiddef g ...