我是如何做数据分析的——以热文、短视频、榜单为例
如今互联网发展已经进入大数据、人工智能的时代,祝建华教授说定量研究(数据分析)是新闻传播学生的核心竞争力,每个人都可以通过数据分析来了解自己,认识媒体。问题是数据必须进行科学分析才能发挥其真正的作用。通过数据挖掘,各大互联网平台都为用户提供了一些基本数据,但用户还需要在此基础上进行深入分析,才能发现有价值的东西,进而选择更理性的处置和应对。下面我试图对热文、短视频和榜单的数据做一些分析。
今年谭天论道公众号第一篇阅读过万的文章是《年度致敬:崔永元、兽爷、丁香医生》(阅读11456、好看104、评论37)。我写这篇文章还是蛮用心的,也获得较好的反响。但也有网友提出质疑,认为这三个人动机不纯,并非伟光正的完人,尤其是作为商业媒体的“丁香医生”。在此,要指出的是我致敬的不是他们整个人,而是在过去一年他们为公众利益发声的行为,我只是肯定他们这些义举。并没有评价他们整个人(机构)。再者,我认为“大公无私”是一种理想追求,值得推崇;但大公有私或大公小私也是一种社会现实,即使他出于私心而为公众谋利也值得肯定。
我认为有些争议其实并不坏,反而会引发公众更多的关注和参与。去年我另一篇阅读过万的文章《咪蒙,你来暨大演讲合适吗?》写得比这篇差多了,为什么也有那么多阅读量呢?因为它的话题性更强,评论有100多条,赞成的和反对的两军对垒,吵了起来,进而引起了围观和转发,引发了传播的裂变。由此可见,话题与争议在网络传播的重要作用。当然,我们也注意掌握话题设置的度。如果对传播裂变理论感兴趣的朋友可以看我的论文《新媒介生态下的电视传播模式——以《百家讲坛》为例》。
当今短视频盛行,我也尝试做了一些短视频并把它放到头条号上。没想到这条时长仅有几秒的小视频《手机大战:一家欢乐一家愁》居然获得十七、八万阅读量,800多条评论。用华为手机的和用苹果手机的吵成一团。为什么一条很简单的短视频会比辛辛苦苦写的文章阅读量更大呢?据《2018年中国网络视听发展研究报告》的数据显示,截至2018年6月,我国网络视频用户规模达6.09亿,短视频用户规模为5.94亿,占网络视频用户97.5%,说明用户对于短视频的需求非常旺盛。只要你把短视频上传到一个足够大的互联网平台,内容新颖有趣加上一定的话题性,那么看的人一定不会少。
日前,有朋友把这份榜单发给我:《高校人文社科学者期刊论文排行榜(2006-2018)》,发现我在两个学科榜上有名:新闻传播学名列43,艺术学竟名列16!我怎么成了艺术家了?后来我了解到这些数据是从知网上抓取的,而知网把电视研究归入艺术学。天哪!难道我研究电视新闻、电视传播的论文也发球艺术学研究?!可见知网和榜单也有不靠谱的地方。由此可见,能否拿到翔实的数据并进行科学的分析至关重要。所以说,不要迷信,不要不加考察的相信基于数据分析和定量研究就一定是科学的。所以说,我们要警惕数据陷阱,要学会辨析真假数据,要懂得数据应用的基本原理。
除了公众号、头条号等自媒体平台提供的基本数据之后,还可以借助其他数据平台提供的数据进行分析,比如清博指数。简单的注册之后,清博免费提供公众号测评数据,如文章阅读量、公众号排名、清博指数等。当然更多的数据提供需要付费,如数据回溯、阅读监测、微信考核、舆情报告等。以下是清博提供的谭天论道最近30天阅读量排名前五篇的文章:
其实我的数据分析还做得不够,这些只是常态的简单应用,用于科研的数据分析还要更加专业更讲究方法。对此,期待各位专家的指教。以下文章或许也可以加深你对大数据与数据分析的学习。