新冠论文爆发,眼花缭乱背后,隐藏着一些有趣结论

自新冠肺炎疫情暴发以来,全球科学家们正以惊人的速度开展应对这一全球公共卫生危机的相关研究,各国科研人员围绕病毒研究、疫情防控和疫苗积极开展科研攻关,产生了海量研究成果。
 
面对让人眼花缭乱的新冠科研论文,学术君通过 AMiner 学术平台进行筛选和分析,发现了一些有趣的结论。
 
1.数据来源
 
论文发表日期:2019 年 12 月 1 日到 2020 年 5 月 17 日。
 
论文发表来源:Nature 及其子刊、Science 及其子刊、The Lancet 及其子刊、生命科学预印本平台 Biorxiv、医学预印本平台 Medrxiv、化学预印本平台 Chemrxiv 和中国科学院科技论文预发布平台 Chinaxiv。
 
论文筛选关键词:COVID-19、novel coronavirus。
 
通过 AMiner 学术平台,我们筛选出 2019 年 12 月 1 日到 2020 年 5 月 17 日期间,发表在以上 7 个期刊及平台的 4490 篇新冠科研论文。这 4490 篇论文的作者及其所在单位,涉及 141 个国家。
 
2.论文发表数最多国家 top10

图1:2019年12月1日到2020年5月17日全球新冠研究论文发表数最多国家top10(美国和中国分别为发表论文数最多的两个国家)

以论文作者所属第一机构所在国家为统计标准,计算各个国家发表的论文数量,结果显示,2019 年 12 月 1 日至 2020 年 5 月 17 日,全世界 141 个国家参与发表了关于新冠疫情的论文。其中参与发表论文数量最多的两个国家为美国和中国,其次分别是英国、德国、加拿大、意大利、法国等。
 
具体而言,前十论文数量分别为——美国: 1805, 中国: 1116, 英国: 723, 德国: 274, 加拿大: 270, 意大利: 248, 法国: 248, 澳大利亚: 227, 印度: 223, 西班牙: 165。
 
3.新冠论文发表国家分布
 
进一步分析全部发表了新冠论文的国家分布,我们发现:按照五大洲分类,在参与发表过关于新冠肺炎的论文的 141 个国家中,分别有 42 个欧洲国家、37 个非洲国家和 35 个亚洲国家。
 
其中,英国是发表论文数量最多的欧洲国家、南非是发表论文数量最多的非洲国家、而中国是发表论文数量最多的亚洲国家。中国发表了超过亚洲总发表论文数 50% 的论文,而非洲和欧洲则分布更加均匀。

图2:2019年12月1日到2020年5月17日亚洲新冠研究论文发表数国家分布

图3:2019年12月1日到2020年5月17日欧洲新冠研究论文发表数国家分布

图4:2019年12月1日到2020年5月17日非洲新冠研究论文发表数国家分布

4.跨国合作分析
 
跨国合作论文的定义:以每一篇论文为一项,依照每篇论文的各个作者所属第一机构所在国家分类,计算不同国家合作发表的论文数量。

图5:2019年12月1日到2020年5月17日全球新冠研究论文跨国合作情况

通过分析发现,2019 年 12 月 1 日到 2020 年 5 月 17 日全球总共发表关于新冠疫情论文 4490 篇,其中,大约三分之二的论文中仅有一个国家参与发表,也就是说只有三分之一的科研论文是跨国合作发表的。
 
此外,在所有发表的论文中,参与国家数量最多的论文,作者单位涉及 31 个国家,其次分别为 23 个国家、21 个国家和 19 个国家。
 
5.发表时间分析
 
将 2019 年 12 月 1 日到 2020 年 4 月 30 日发表的论文按照月份分类,对全球发表新冠肺炎论文数量的月度变化进行分析。

2019 年 12 月 1 日到 2020 年 5 月 17 日全球总共发表关于新冠疫情论文 4490 篇,其中,2019 年 12 月发表了 129 篇论文、1 月 153 篇、2 月 386 篇、3 月 852 篇、4 月 1748 篇。
 
结果显示,全球发表就新冠疫情论文数量逐月增加,且增速显著。2020 年 1 月较前一年 12 月比发表论文数量增加了 18.6%,而 2 月较一月比发表论文数量增加 152.3%,此后两个月的论文数量增长比例均高于 100%。
 
6.不含预印本的论文发表情况分析
 
通过剔除生命科学预印本平台 Biorxiv、医学预印本平台 Medrxiv、化学预印本平台 Chemrxiv 和中国科学院科技论文预发布平台 Chinaxiv 来源的相关论文,统计出 2019 年 12 月 1 日至 2020 年 5 月 17 日共有 743 篇相关论文发表,作者单位涉及 115 个国家。
 
其中,发表论文数量最多的国家分别为——美国: 385, 英国: 281, 中国: 130, 德国: 91, 澳大利亚: 91, 加拿大: 85, 法国: 85, 意大利: 76, 瑞士: 71, 荷兰: 65。

剔除预印本平台来源的论文后,2019 年 12 月 1 日到 2020 年 5 月 17 日全球总共发表关于新冠疫情论文 743 篇,其中,2019 年 12 月发表了 111 篇论文、1 月 118 篇、2 月 119 篇、3 月 140 篇、4 月 117 篇。
 
结果显示,随着疫情的全球大流行,经同行评议发表的论文数量,一直把持稳定的数量。这也表明,全球新冠相关论文的大爆发,主要来自于 2020 年 3 月之后的预印本平台。
 
2020 年 2 月预印本平台来源的论文数量,是经同行评议发表论文数量的 2.2 倍,3 月是 5.1 倍,4 月是 13.9 倍。
 
7.预印本与经同行评议论文的不同
 
科学家分享他们研究结果的传统方式,是凭借同行评议的学术期刊来发表。
 
一位科学家或是科研团队在进行科学研究的过程中,将其研究成果总结成文,并发表到涵盖某些特定研究领域的期刊,对于影响较大的研究成果,也可以选择 Nature 或 Science 这样的综合期刊出版物。
 
当期刊收到论文后,会将论文的副本寄给同一领域的三位科学家来审阅,这些审稿人将对论文进行高度批判性的审稿,寻找研究方法和分析中的缺陷,以及其它潜在的问题。如果审稿人没有发现任何问题,论文就会顺利通过,并很快发表出来。

但更为常见的情况是,会有一位或多位审稿人发现他们认为存在的异议或不足的地方。每位审稿人都会将他们的想法发给期刊编辑,通常还会给作者传递一些问题或建议,这些问题或建议通常需要在编辑接受研究论文发表之前得到解决。
这些问题和建议对论文有时有益,有时不然。相信很多有过科研经验的研究生、博士们,都经历过许多彻夜难眠的 "返稿修改" 的故事。
虽然这个过程并不完美,而且耗时较长,从论文初稿提交给期刊到最终发表,往往需要几周甚至几个月的时间,还需经历多次修改,但这就是目前最科学、严谨、正规的论文发表流程。
事实上,传统的同行评议发表模式并不新鲜,已经有着数百年的历史了。在 20 世纪 90 年代的某个时候,物理学界的研究人员决定对其进行改进。
由于在只有两三个研究生和一个主要研究人员协助的情况下,研究人员无法真正地运行一个大规模的粒子加速器或实验核反应堆,因此许多物理学家已经习惯于通过大型合作项目一起工作,并与整个团队交换论文草稿。在进入互联网时代后,他们创建了 arxiv - repository 这样的服务器,来共享尚未经过同行评议和正式发表的研究论文。
逐渐地,这些研究人员不再只是与他们的团队分享研究成果,转而开始与整个研究领域的科学家们分享。其他未参与研究工作的科学家可以在研究结果发表前,阅读这些研究成果,并与其他科学家们和论文作者讨论其中的内容,这就产生了 "预印本" 这一术语。
随着时间的推移,新一代心怀不满的生物学家们也对传统发表过程的僵化表示出了越来越多的不满,像他们在高能物理学领域的同行一样,生物医学研究也逐渐出现了大型的多学科合作项目,于是,在基因组学研究人员的带领下,像 bioRxiv 和 medRxiv 这样的预印本服务器开始在生物医学领域被创建出来。
预印本的吸引力是显而易见的。科学家们可以更迅速地传播他们的研究结果,年轻的研究人员可以向资助机构和招聘委员会表明,他们在等待草稿通过同行评议的同时,正在提高效率,为这个领域做出贡献。在预印本服务器上发表自己的研究结果,还意味着研究结果可以被广泛访问,而非只有通过付费才能获得访问权限。在短短几年内,在生物医学研究中使用预印本服务器的做法已经迅速流行起来。
一项在 2019 年进行的研究显示,自 2014 年 bioRxiv 创建以来的前五年里,上传到 bioRxiv 的论文数量迅速增加,新论文的投稿速度也在快速增长。在这段时间里,biorXiv 的下载量也有了同样惊人的增长。
令人鼓舞的是,该研究还发现,在 bioRxiv 创建后的前四年内,发布在 bioRxiv 服务期上的预印本中,有三分之二的论文后来在同行评议的期刊上发表。但是,如果把最近提交的论文也包括在内,这个数字恐怕会低得多,这也清楚地表明,一篇论文的出版需要很长的时间。

8.预印本论文爆发的争议
 
在这次大流行期间,医学领域预印本平台 medRxiv 和生物学领域预印本平台 bioRxiv 的地位得到了极大地提升。
 
RetractionWatch.org 联合创始人、纽约大学医学新闻学教授 Oransky 就表示:“预印本机构在新冠病毒相关领域——笼统来讲,在生命科学和临床医学领域——比以往任何时候都重要得多。在此之前,他们根本就算不了什么。”
 
但是,一项真正完整的研究,理论上是需要刊登在可靠科学杂志上的,而发表的前提,就必须要这项研究经过一个叫做“同行评审”的过程。

约翰霍普金斯大学(Johns Hopkins University)病理科助理教授凯特·格拉博夫斯基(Kate Grabowski)将“同行评审”过程称为“审核论文的多双眼睛”。虽然同行评审并不是万无一失的,但它通常可以综合在某一特定领域的许多人的专业知识。“我认为这(同行评审)是发现潜在错误的重要一环。通常当我们提交论文的时候,它们就像草稿,然后可能会被修改(几次),直到它们变得更加严谨准确,”Grabowski 说:“这个过程是反复的。然而,预印本论文的大量涌现让新闻中报道的科学研究,多多少少跳过了同行评审的环节。”
 
与过去曾发生过的流行性疾病相比,新冠肺炎(COVID-19)疫情存在一个明显的不同,就是随着疫情的传播,科学家们急于将初步研究数据和分析结果放到网上,希望卫生部门能够从中受益,在此情况下,大量的学术研究论文在未经同行评议之前发布到可公开访问的服务器上。

而当未经审核的科学成果直接向公众公开发表时,可能会引发一些问题。比如这些未经同行评议的文章可能质量参差不齐,而那些希望引起人们关注的预印本文章,在通过同行评议之后可能会做出重大修改,但这对社会决策的严重影响可能已经产生。

学术头条此前曾写过一篇题为《一些科学家急于将新冠研究发到网上,未经证实的科研成果“带偏节奏”读者难以辨别》的文章,以提醒读者预印本的精灵已经从瓶子里出来了,我们当客观辩证地阅读科研成果。
 
卡内基梅隆大学道德与政策中心主任、Clara L. West 的伦理学与哲学教授 Alex John London 和麦吉尔大学生物医学伦理部教授兼主任 Jonathan Kimmelman 也曾在 Science 杂志网站发表文章,指出在这场 COVID-19 全球大流行中,首批出炉的许多论文都设计得很糟糕,没有很好的论据,或者报告的方式有失偏颇。在他们之后发表的大量论文重复率很高,有些研究甚至将目的放在如何受到媒体极大可能的关注上,从而增加了研究结果不可靠的风险。
 
虽然 bioRxiv 和 medRxiv 两个预印本服务器的优点显而易见,研究结果可以快速传播,可能为政策研究提供信息支撑,可能加速疫苗研发和治疗研究的进度,但它们的受欢迎程度,也让人注意到这些研究所受到的审查过程存在的问题。
 
毫无疑问,在新冠全球大流行时局紧迫的大环境下,速度至关重要。科学家们正尽快了解这种病毒、这种疾病以及如何防止人们死亡;卫生官员正尽快制定健全的公共卫生措施,避免社会负担过重或经济停滞;而记者们正筋疲力尽地试图尽快报道这一切。同样,科学家们和记者们也对于这不停加速的一切表示担忧,因为很多科研报道都并没有足够的时间进行验证。事实上,许多发表出的所谓论文根本不是研究,而是基于数据和调研方法推测得出的主观结论,而且文章中的相关数据和调研方法描述隐晦,从而加大了验证难度。
 
这也让关于新冠病毒的相关研究都蒙上了一层迷雾。

数据来源:
https://covid-dashboard.aminer.cn/(点击文末阅读原文,跳转查看)
(0)

相关推荐