如何阅读学术文献
最近在跟着导师做一些研究性的内容,需要做一些论文阅读的工作。无意中看到了这一篇有关阅读文献的方法,翻译一下,自己做一点整理,分享出来。
之前读论文的时候都是大段翻译,虽然在内容上不会有什么遗漏,但是在做汇报整理的时候,效率很低,还是需要反复看自己翻译的内容,有的时候还需要对照原文,而且总体阅读论文的效率也很低。看了这篇文章的方法之后,尝试着实践了一下,发现效率还是提高了不少。当然方法论这种东西,不能照搬,还是需要自己慢慢实践,形成自己的方法论。
附上原文地址,我是原文地址。
译文内容
以下内容是我翻译原文的部分,可能会有些个小语法错误,或者不通顺的地方,大家担待着看,实在看不下去了,就看看原文吧……(逃
在开始之前:一些一般性的建议
不同于在博客或报纸上相关科学文章,阅读科学论文是一个完全不同的过程。你不仅需要按不同的顺序阅读论文,还需要做笔记,多次读文章的某一部分,而且可能需要反复查看其他章节的一些内容。第一次读论文的时候,可能需要花费很多时间。耐心一点,到你有阅读经验的时候,读论文的过程会加快很多。
大多数研究性文献会分为以下几个部分:摘要,简介,方法,结果,以及结论/说明/讨论。顺序会跟出版这篇文章的期刊有关。有些期刊会包含额外的内容(称为在线补充信息),其中会包含一些重要的研究细节,但是是在线发布的,而不是添加在文章中(请确保你在阅读文献的时候没有漏掉这些内容)。
在开始阅读之前,关注一下作者和他所属机构的信息。一些机构(例如德克萨斯大学)会更有权威一些,而其他的机构(如发现研究院)可能会有一些权威性的研究,但是他们实际上是有导向性的。Tip:google搜索一下“Discovery Institute”,来看看你为什么不想引用他的研究内容作为进化论的权威理论依据了。
此外,还需要注意出版文献的期刊。可靠的生物医学期刊会被Pubmed编入索引。谨防有问题的期刊。
在阅读的过程中,记下所有不认识的单词。你肯定需要查这些词的意思(没错,每一个不认识的词都需要查。我知道这是一个痛苦的过程。但如果你不明白每个词的含义,可能就没法理解整篇论文。科学词汇都有很明确的含义(extremely precise meaning))。
阅读文献的分步说明
1. 从简介开始读,而不是从摘要开始
摘要是一篇论文密集的开头第一段。事实上,这是需要非科研人员试图完成科学论证时阅读的论文的唯一一部分(这是一个非常可怕的做法,千万不要这样做)。当我搜集论文的时候,我会根据标题和摘要确定论文是否与我关注的内容有关。但当我明确需要详细阅读的论文之后,我通常最后再读摘要。我这样做是因为摘要包含了整篇文章简明扼要的总结,我担心(在没有仔细阅读全文之前)会不经意间对作者说明结果的部分产生偏差。
2. 明确大问题(背景)(Big Question)
不是“这篇论文是关于什么内容”,而是“这篇论文在试图解决领域中的什么问题”。
这有助于你更专注于为什么要进行这样的研究。密切关注研究的理论依据。
3. 五句话以内,总结背景信息
这里有几个帮助你总结的小问题:
在领域中已经有哪些解决这个大问题的相关研究工作?这些研究有哪些局限性或不足?根据作者的说法,接下来的研究方向应该是什么?
这个五句话以内的总结可能有些随意,但是它迫使你简洁、深入的思考这篇论文的背景。你需要解释为什么要进行这个研究,来更好的理解这篇论文。
4. 明确具体的问题(SPECIFIC QUESTION(S))
作者试图用他们的研究来解决什么问题?可能是几个问题,也可能只有一个。把它们记下来。如果论文是检验一个或多个零假设,那么把这些假设都找出来。
请记住,并不是所有的论文都是验证零假设。
5. 明确作者提出的方法
就是作者用来解决具体问题的方法。
6. 现在阅读文中的方法部分。对每个实验都画出示意图,明确作者做了什么。
我的意思是字面上的画,包括所有有助于你理解方法的细节。
你不需要太深入的理解方法,再现整个实验过程——这是评测人员需要做的工作——但是在你不能给其他人解释清楚方法的基本理论之前,最好不要往下看实验结果部分。
7. 阅读结果部分。对每个实验、图标都写一小段总结。先不要尝试确定这些结果说明了什么,只要把结果记下来就好。
你会发现,特别是在好的论文中,大部分结果都是总结在图表中的。重点关注这些图表。你可能需要到“在线补充信息”中查找一些信息。
在这一点上,如果你没有足够的背景知识来理解文章采用的统计测试,那么(你阅读这一部分)可能会产生困难。本文中我无法教你更多的统计知识,但是以下几个资源可以帮助你,Here,Here&Here。
结果中应该关注的内容:
包含“significant”、“non-significant”字眼的地方,这些(通常)都有明确的统计含义,仔细阅读这一部分内容。
如果有图表,其中是否包含错误线(error bar)?对于某些类型的研究,缺少置信区间是一个非常严重的问题(major red flag)。
样本的大小。研究是基于10个人进行的,还是基于10000个人进行的?(对于某些研究而言,10个人的样本就足够了,但是对于大多数研究而言,样本越大越好。)
8. 结果是否解决了具体问题(SPECIFIC QUESTION(S))?你觉得这个有什么意义?
在你没有想清楚这两个问题之前,不要继续下一步。根据作者的说明,改变自己的观点是没问题的——事实上,如果你是这类课题研究的初学者的话,你可能会这样做——但是在阅读别人的理论之前,最好开始形成自己的理论体系。
9. 阅读结论/讨论/说明的部分
作者认为结果说明了什么?你同意她的观点吗?你是否(在结果说明上)有不同于作者的观点呢?作者是否说出了他研究的不足呢?你有没有发现作者漏掉了什么内容?(不要认为他们是绝对正确的!)他们建议下一步应该进行什么?你同意他的观点吗?
10. 现在,回到论文开头,读一读摘要吧
(这部分内容)是否符合作者在论文中所述的内容?是否跟你对论文的解读相符?
11. 最后一步:(不要忽视这些)其他研究人员对这篇论文有什么看法?
这个领域中(公认的或自称的)的专家有哪些?他们是反对这个研究内容,还是支持这个研究?
这里我建议你使用谷歌来收集这类信息。但最后再用谷歌,这样你可以有更充分的准备来理解其他人说的内容。
12. 这一步是可选的,取决于你为什么要读这篇论文
查看“引用文献”这一块的内容,看看作者引用了哪些其他的论文,这可以帮助你更好地识别特定领域的重要论文,并且找到一些有用的想法和理论。
个人心得总结
这一部分其实没有什么参考价值,只是记录一下自己的总结和这几天实践过程中的一些小心得。下面的条目,除了针对文中的方法的做了一点小结,也是我记笔记的几个大块主题。
摘要部分
在做论文survey的时候,摘要可以帮助你快速的了解论文内容,但是深入阅读的时候,最好最后读,防止先入为主的想法对之后的阅读产生影响
这部分的话,暂时还没有明显的感觉,我目前还是习惯性的先读摘要。不过上文说的也很有道理,最后再读摘要,一来可以帮助更好的总结整篇论文的内容,从背景到问题到实验结论;二来可以帮助检查是否漏掉了文中的一些内容,用摘要跟自己的总结对照一下,看看有没有漏掉的信息。
简介部分
这部分就要重点记笔记了,这一部分作者会大段的描述问题背景,当前的研究情况,存在的问题等等。当然这一部分可能不止是论文中的第一章,有可能还会包含类似“Related Work”这样的章节。
这块我记得内容主要分为以下几个部分:
背景
这一块主要就是确定大的Topic。我大概会记下几个关键词,方便之后根据这几个关键词搜其他的相关文献。
目前存在的问题
这个部分作者一般都会总结近些年的其他比较不错(引用率较高,或者领域内公认)的研究成果,或者一些权威的始祖级方法,而且会描述一下这些方法存在的问题。
笔记的话,记一下主要存在的问题,因为作者之后的方法会围绕这些具体问题展开。如果可以的话,建议也阅读以下提到的方法,因为之后的实验部分有可能会拿来作比较,同时也方便学习一下这些论文的思想和提到的理论。
作者提出的方法
这个部分作者会开始介绍自己提出的方法,一般会包含:理论基础(假设)、采用的方法以及结果。
笔记就围绕这几个点展开:理论基础、方法、结果。
理论基础(如果提到了的话)
这一部分作者会介绍方法的理论基础,这一部分记笔记也需要像方法部分一样详细。
如果是假设一类的话,笔记会少一些,因为假设一般来说会将问题简化,而且假设之所以为假设,是因为还没有严格的证明,但是确实对结果产生了正面的影响。
如果是改进方法类的文献或者是基于现有的多种方法结合的话,那么恭喜你,笔记会多到爆炸——因为你需要读额外的论文记笔记,理解这部分内容。
这一部分如果没有理解的话,之后的方法和实验部分我觉得读了也是白花时间,所以一定要搞懂理论基础这部分内容。
方法(Method)
这一部分作者就会展开介绍方法的详细内容,笔记的话就如上文所说,记录的越详细越好。
对于我的专业而言,需要记录的就是提到的公式,公式的理论基础,具体的算法流程和伪代码。
结果以及总结
这一部分,笔记主要记的就是结果的内容,再有就是这个方法仍存在什么不足,还有哪些可以改进的地方。因为是刚刚开始接触目前的领域,而且之前也没有做过研究相关的东西,所以不能像上文中思考很多东西,目前就是不断学习,然后整理。
最后一点小小的吐槽
关于读论文过程中发现需要读其他论文才能继续
这一块感触很深,尤其是理论基础的部分,分分钟在论文栈加几篇论文。不过的话,可能跟我是计算机专业有关,对于递归的方式看论文,虽然有抵触,但是衔接过程还是没啥问题。(不过总感觉,有一天论文栈会爆栈,2333)
关于记笔记
这是这几天实践过程中,发现的一个最严肃的问题。论文不可能一次读完,笔记也不可能一次记完。就好像写作一样,初稿写完之后,需要反复斟酌,修改,才可以发出去。笔记也一样,反复的阅读论文之后,总会发现自己漏掉、或者记错的地方,加以补充和改正。这样也方便了之后工作的展开。
试想,如果拿着不完整或者有错误的笔记,来做实验,小实验还好,如果是那种,一下需要好几天甚至几个月的大型实验……画面太美,不敢想象……那样的话,我想一定会有人要砍死我的……
时间宝贵,所以为了避免尴尬,看论文的时候多看几次吧。
关于整理笔记
当然,对于我而言读论文整理笔记,目前还没有上升到自己写论文的高度,大多数时间都是小组汇报,或者实现论文的方法做实验。所以整理笔记至关重要,自己写的笔记是不可能直接拿给组员看的,所以还要苦逼的整理成PPT或者PDF,让其他没有看过这篇文章的组员能快速,简洁的明确论文内容,学习到思想。