基于京东手机销售数据的爬虫及可视化 来自 陆小北
买数码3C,大家首选的平台应该是京东吧,不仅物流速度快,有正品保证,退换也很方便,所以京东手机销量数据在几家电商平台有一定的代表性。
项目名称:基于京东手机销售数据的爬虫及可视化
数据来源:基于京东关键词“手机”搜索,爬取80页手机商品信息
项目需求:
基于京东关键词搜索爬取信息
数据清洗
输出销量前十的商品信息并可视化
输出手机价格分布信息并可视化
输出好评大于0.98的商品信息
找出2020年手机年度关键词
代码实现:
1、爬虫部分
理论上讲:只要改变keyword,便可爬取任意商品信息
共爬取数据2323条、5列,分别为商品名、商品价格、店铺名、评论数和好评比
2、数据清洗
爬取的数据又重复行 和 评论数为0的商品信息,于是将它们进行删除处理。
输出销量前十的商品信息并可视化
输出手机价格分布信息并可视化
输出好评大于0.98的商品信息
找出2020年手机年度关键词
项目总结:
1、OPPO产品线逐渐成熟,千元机realme 扛起大旗,中端机型有reno系列,且这两款手机不仅销量高,而且好评如潮
2、苹果手机依旧坚挺,xr 和 12 两款手机同时出现在销量榜单
3、小米还是靠红米中低端撑起,三款上榜销量前十的都为readmi,且都为2000元以下
4、华为nova7 能上销量榜我是真没想到,nova系列不是主打线下嘛
,而且华为的中高端机型 mate30、p40 一个也没有
,出乎意料
5、好评榜惊现8848手机??? 居然有10万+的评价,果然贫穷限制了我的想象
6、从价格分布图看,手机价格分布主要还是在2000元以下为主,2000-5000中高端市场大约占1/4
7、从卖点图来看,5G无疑是2020年最大的卖点,Ai、大电池、90hz、120hz刷新率、拍照也是厂家争相展示的卖点
代码仅供学习交流,切勿用于商业!!!
赞 (0)