有多少科研论文不是原创的?
有多少科研论文
不是原创的?
01
论文剽窃现象
是否在阻碍着科学的发展呢?
Charles Babbage在1830年就对不可靠的科研结果进行了曝光。他讨论了欺骗、伪造、篡改数据以及拼凑(挑选有利数据)的现象。目前,可疑的论文可能涉及剽 窃数据、伪造数据或曲解数据。而Citron和Ginsparg的这项研究结果则反映出了一个极端的问题:仅仅在一种期刊上,就“猖獗”地存在着科研剽 窃。而更复杂的科研欺骗行为则可以在retractionwathc.com这个网站上查询到,包括伪造的或欺骗性的数据。Begley和Ellis曾针 对伪造数据的研究进行了调查,他们发现,53项肿瘤研究中有高达47项实验无法被重复。
02
在科研结果逐渐丧失其可信度的现状下应该怎样采取应对措施呢?
仅2012年,就有超过200万篇文献发表。在这数量庞大的文献中,有一些发表于顶级科研期刊,例如 《Nature》、《Science》、《Lancet》等,也有一些是通过唯利是图的出版商所发表的(只要付钱就会给予发表)。大学老师对于发表文章的 需求尤为强烈,因为他们的考核制度就是基于其文章发表的数量和被引用的数量。如今这种追求h-指数(h-index)的现状,正应了那句俗话 :“校长读不懂论文,他只会数论文”。有些国家甚至会给在顶级期刊上发表文章的作者颁发高额奖金,如中国浙江大学给那些在《Nature》或 《Science》上发表文章的作者高达3万美元的奖励。
在这种奖励制度下,也就难怪一些作者开始挖空心思地想对策了。Delgado等研究人员就曾发表文章,论述了他们是如何伪造出6篇索引次数多达百次的论文的。其中一个作者成功使得其论文的影响因子升至2分,h-指数从10增加至15。
而评审工作,至 少对部分期刊而言,显得非常不严谨。Citron和Ginsparg在文中提到,Bohannon曾尝试着将一篇伪造结果的论文向300个公开发行的杂志 投稿,结果竟有超过一半的期刊接受了这篇论文。甚至,他还发现其中一份期刊竟然从另一份享有盛誉的期刊中抄袭了他这篇论文的内容。基于这种现状,网站 Scholarlyoa.com正在尝试归类出信用度低的出版商及其期刊。
而相对于完全伪 造的论文,更加常见的是“最小可发表单元”,即将一篇论文拆分成多份可单独发表的短篇报告。不少出版商以及会议主办商都做过这样的“勾当”。Whilhite和Fong曾发表文章,描述了一位编辑是如何要求论文作者增加对其期刊中文章的引用而提升期刊影响因子的。
03
欺骗和伪造的科 学会影响现实世界。
例如,数十年来,英国的教育系统一直非常看重11-plus(英国的一种旧考试制度,学生在11岁时参加考试,决定能否升入更高的学 校)的测试结果,推崇由Sir Cyril Burt所提出的这套测试智商的理论。Burt对大量从小被分开抚养的双胞胎进行了研究而得出了这套理论。然而,在他去世后不久,他的研究结果就受到了质 疑,因为研究结果太过完美,而且无法找到原始数据,其他共同研究者也失踪了。尽管存在着不少争议,Burt的支持者仍认为Burt只是比较粗心而并非论文 造假,而且,其他研究遗传和智商相关性的研究也得出了类似的结果。
如果论文的内容 比数量更为重要,那么剽窃现象就不会如此猖獗。
其实,文章发表数量的多少并不重要。
成败的关键不在于智慧的数量,而在于质量。与之类似,美国国家科学基金会明确要求那些提交科研申请的人只列举5条最具相关性且最重要的文献,而不是一长串的参考文献列表。
值得庆幸的是,Citron和Ginsparg在文中提到,剽窃现象比较集中:他们发现只有一小部分作者会集中性地发表令人质疑的文章。而且,这些文章的被索引率并不高,表明其影响力不大。此外,有许多重要的科研大国的剽窃率还是很低的。相反地,论文的剽窃行为依赖于内容的重复度,如果是将论文翻译为另一种语言或进行重新编辑而不加入任何实质的新内容,这些情况的抄袭是无法被检测到的。
04
那么,对此我们能做些什么呢?
Cintron和Ginsparg在研究中发现,论文剽窃与科研氛围密切相关:有些国家在ArXiv所发表的论文抄袭率高达15%,而有些国家则非常低。因此,科学界是否能够通过软硬兼施的手段来给各国的科研机构施压并强化这方面的规范制度?毕竟现在极少有科研人员不隶属于任何科研机构了,通过机构来影响科研作风应该是比较有效的方式。
对于实验性研究而言,要求实验数据的可用性是可行的一步。如果论文并非是由作者自己所撰写的,那么他很可能并没有论文背后的数据。当然,实验数据可以被抄袭,但这就增加了被剽窃排查软件探测到的几率,而且重新编辑数据比编辑文字更为复杂。
《Nature》杂志在2年前曾发表一篇文章提出,出版商应该告知研究机构,一旦发现有研究人员剽窃了论文内容,那么会将 整个研究机构拉入黑名单。出版商可以采取一些适度的惩罚措施,例如延迟发表而非完全拒绝发表。
总结
总体而言,Citron和Ginsparg主要调查了ArXiv上论文的剽窃情况。让人略感安慰的是,剽窃检测软件能有效地找到涉嫌抄袭的论文,而且这些抄袭现象集中在少部分作者和国家中,且抄袭的论文影响力不大。坏消息是,这些问题切实存在,且在一些国家中比较严重。如今,ArXiv正在对那些有抄袭内容的论文进行鉴别,并期待能抵制劣质论文的提交。对于出版界来说,也许是时候采取更加有力的措施了。
我国科学界也常常会曝出论文抄袭的丑闻,作为一个科研产量大国,政府和科研机构应该转变思路,更加关注论文质量,而非论文的数量或是h-指数。