基于京东手机销售数据的爬虫及可视化 来自 陆小北

买数码3C,大家首选的平台应该是京东吧,不仅物流速度快,有正品保证,退换也很方便,所以京东手机销量数据在几家电商平台有一定的代表性。

项目名称:基于京东手机销售数据的爬虫及可视化

数据来源:基于京东关键词“手机”搜索,爬取80页手机商品信息

项目需求:

基于京东关键词搜索爬取信息

数据清洗

输出销量前十的商品信息并可视化

输出手机价格分布信息并可视化

输出好评大于0.98的商品信息

找出2020年手机年度关键词

代码实现:

1、爬虫部分

理论上讲:只要改变keyword,便可爬取任意商品信息

共爬取数据2323条、5列,分别为商品名、商品价格、店铺名、评论数和好评比

2、数据清洗

爬取的数据又重复行 和 评论数为0的商品信息,于是将它们进行删除处理。

输出销量前十的商品信息并可视化

输出手机价格分布信息并可视化

输出好评大于0.98的商品信息

找出2020年手机年度关键词

项目总结:

1、OPPO产品线逐渐成熟,千元机realme 扛起大旗,中端机型有reno系列,且这两款手机不仅销量高,而且好评如潮

2、苹果手机依旧坚挺,xr 和 12 两款手机同时出现在销量榜单

3、小米还是靠红米中低端撑起,三款上榜销量前十的都为readmi,且都为2000元以下

4、华为nova7 能上销量榜我是真没想到,nova系列不是主打线下嘛

,而且华为的中高端机型 mate30、p40 一个也没有

,出乎意料

5、好评榜惊现8848手机??? 居然有10万+的评价,果然贫穷限制了我的想象

6、从价格分布图看,手机价格分布主要还是在2000元以下为主,2000-5000中高端市场大约占1/4

7、从卖点图来看,5G无疑是2020年最大的卖点,Ai、大电池、90hz、120hz刷新率、拍照也是厂家争相展示的卖点

代码仅供学习交流,切勿用于商业!!!

(0)

相关推荐