新冠论文爆发,眼花缭乱背后,隐藏着一些有趣结论
面对让人眼花缭乱的新冠科研论文,学术君通过 AMiner 学术平台进行筛选和分析,发现了一些有趣的结论。
1.数据来源
论文发表日期:2019 年 12 月 1 日到 2020 年 5 月 17 日。
论文发表来源:Nature 及其子刊、Science 及其子刊、The Lancet 及其子刊、生命科学预印本平台 Biorxiv、医学预印本平台 Medrxiv、化学预印本平台 Chemrxiv 和中国科学院科技论文预发布平台 Chinaxiv。
论文筛选关键词:COVID-19、novel coronavirus。
通过 AMiner 学术平台,我们筛选出 2019 年 12 月 1 日到 2020 年 5 月 17 日期间,发表在以上 7 个期刊及平台的 4490 篇新冠科研论文。这 4490 篇论文的作者及其所在单位,涉及 141 个国家。
2.论文发表数最多国家 top10
图1:2019年12月1日到2020年5月17日全球新冠研究论文发表数最多国家top10(美国和中国分别为发表论文数最多的两个国家)
以论文作者所属第一机构所在国家为统计标准,计算各个国家发表的论文数量,结果显示,2019 年 12 月 1 日至 2020 年 5 月 17 日,全世界 141 个国家参与发表了关于新冠疫情的论文。其中参与发表论文数量最多的两个国家为美国和中国,其次分别是英国、德国、加拿大、意大利、法国等。
具体而言,前十论文数量分别为——美国: 1805, 中国: 1116, 英国: 723, 德国: 274, 加拿大: 270, 意大利: 248, 法国: 248, 澳大利亚: 227, 印度: 223, 西班牙: 165。
3.新冠论文发表国家分布
进一步分析全部发表了新冠论文的国家分布,我们发现:按照五大洲分类,在参与发表过关于新冠肺炎的论文的 141 个国家中,分别有 42 个欧洲国家、37 个非洲国家和 35 个亚洲国家。
其中,英国是发表论文数量最多的欧洲国家、南非是发表论文数量最多的非洲国家、而中国是发表论文数量最多的亚洲国家。中国发表了超过亚洲总发表论文数 50% 的论文,而非洲和欧洲则分布更加均匀。
图3:2019年12月1日到2020年5月17日欧洲新冠研究论文发表数国家分布
4.跨国合作分析
跨国合作论文的定义:以每一篇论文为一项,依照每篇论文的各个作者所属第一机构所在国家分类,计算不同国家合作发表的论文数量。
通过分析发现,2019 年 12 月 1 日到 2020 年 5 月 17 日全球总共发表关于新冠疫情论文 4490 篇,其中,大约三分之二的论文中仅有一个国家参与发表,也就是说只有三分之一的科研论文是跨国合作发表的。
此外,在所有发表的论文中,参与国家数量最多的论文,作者单位涉及 31 个国家,其次分别为 23 个国家、21 个国家和 19 个国家。
5.发表时间分析
将 2019 年 12 月 1 日到 2020 年 4 月 30 日发表的论文按照月份分类,对全球发表新冠肺炎论文数量的月度变化进行分析。
结果显示,全球发表就新冠疫情论文数量逐月增加,且增速显著。2020 年 1 月较前一年 12 月比发表论文数量增加了 18.6%,而 2 月较一月比发表论文数量增加 152.3%,此后两个月的论文数量增长比例均高于 100%。
6.不含预印本的论文发表情况分析
通过剔除生命科学预印本平台 Biorxiv、医学预印本平台 Medrxiv、化学预印本平台 Chemrxiv 和中国科学院科技论文预发布平台 Chinaxiv 来源的相关论文,统计出 2019 年 12 月 1 日至 2020 年 5 月 17 日共有 743 篇相关论文发表,作者单位涉及 115 个国家。
其中,发表论文数量最多的国家分别为——美国: 385, 英国: 281, 中国: 130, 德国: 91, 澳大利亚: 91, 加拿大: 85, 法国: 85, 意大利: 76, 瑞士: 71, 荷兰: 65。
剔除预印本平台来源的论文后,2019 年 12 月 1 日到 2020 年 5 月 17 日全球总共发表关于新冠疫情论文 743 篇,其中,2019 年 12 月发表了 111 篇论文、1 月 118 篇、2 月 119 篇、3 月 140 篇、4 月 117 篇。
结果显示,随着疫情的全球大流行,经同行评议发表的论文数量,一直把持稳定的数量。这也表明,全球新冠相关论文的大爆发,主要来自于 2020 年 3 月之后的预印本平台。
2020 年 2 月预印本平台来源的论文数量,是经同行评议发表论文数量的 2.2 倍,3 月是 5.1 倍,4 月是 13.9 倍。
7.预印本与经同行评议论文的不同
科学家分享他们研究结果的传统方式,是凭借同行评议的学术期刊来发表。
一位科学家或是科研团队在进行科学研究的过程中,将其研究成果总结成文,并发表到涵盖某些特定研究领域的期刊,对于影响较大的研究成果,也可以选择 Nature 或 Science 这样的综合期刊出版物。
当期刊收到论文后,会将论文的副本寄给同一领域的三位科学家来审阅,这些审稿人将对论文进行高度批判性的审稿,寻找研究方法和分析中的缺陷,以及其它潜在的问题。如果审稿人没有发现任何问题,论文就会顺利通过,并很快发表出来。
8.预印本论文爆发的争议
在这次大流行期间,医学领域预印本平台 medRxiv 和生物学领域预印本平台 bioRxiv 的地位得到了极大地提升。
RetractionWatch.org 联合创始人、纽约大学医学新闻学教授 Oransky 就表示:“预印本机构在新冠病毒相关领域——笼统来讲,在生命科学和临床医学领域——比以往任何时候都重要得多。在此之前,他们根本就算不了什么。”
但是,一项真正完整的研究,理论上是需要刊登在可靠科学杂志上的,而发表的前提,就必须要这项研究经过一个叫做“同行评审”的过程。
与过去曾发生过的流行性疾病相比,新冠肺炎(COVID-19)疫情存在一个明显的不同,就是随着疫情的传播,科学家们急于将初步研究数据和分析结果放到网上,希望卫生部门能够从中受益,在此情况下,大量的学术研究论文在未经同行评议之前发布到可公开访问的服务器上。
而当未经审核的科学成果直接向公众公开发表时,可能会引发一些问题。比如这些未经同行评议的文章可能质量参差不齐,而那些希望引起人们关注的预印本文章,在通过同行评议之后可能会做出重大修改,但这对社会决策的严重影响可能已经产生。
学术头条此前曾写过一篇题为《一些科学家急于将新冠研究发到网上,未经证实的科研成果“带偏节奏”读者难以辨别》的文章,以提醒读者预印本的精灵已经从瓶子里出来了,我们当客观辩证地阅读科研成果。
卡内基梅隆大学道德与政策中心主任、Clara L. West 的伦理学与哲学教授 Alex John London 和麦吉尔大学生物医学伦理部教授兼主任 Jonathan Kimmelman 也曾在 Science 杂志网站发表文章,指出在这场 COVID-19 全球大流行中,首批出炉的许多论文都设计得很糟糕,没有很好的论据,或者报告的方式有失偏颇。在他们之后发表的大量论文重复率很高,有些研究甚至将目的放在如何受到媒体极大可能的关注上,从而增加了研究结果不可靠的风险。
虽然 bioRxiv 和 medRxiv 两个预印本服务器的优点显而易见,研究结果可以快速传播,可能为政策研究提供信息支撑,可能加速疫苗研发和治疗研究的进度,但它们的受欢迎程度,也让人注意到这些研究所受到的审查过程存在的问题。
毫无疑问,在新冠全球大流行时局紧迫的大环境下,速度至关重要。科学家们正尽快了解这种病毒、这种疾病以及如何防止人们死亡;卫生官员正尽快制定健全的公共卫生措施,避免社会负担过重或经济停滞;而记者们正筋疲力尽地试图尽快报道这一切。同样,科学家们和记者们也对于这不停加速的一切表示担忧,因为很多科研报道都并没有足够的时间进行验证。事实上,许多发表出的所谓论文根本不是研究,而是基于数据和调研方法推测得出的主观结论,而且文章中的相关数据和调研方法描述隐晦,从而加大了验证难度。
这也让关于新冠病毒的相关研究都蒙上了一层迷雾。