论文写作基本注意事项和技巧
注意:
科研是有领域划分的。不同的研究领域有不同的表述方式。我们是做深度学习和图像处理的,这些经验只能保证在我们的研究领域内的参考价值。
这些技巧是在读过写过一些论文之后总结出来的,仅仅是一些个人浅显的见解,可能对有一点经验的新手有点帮助,故以记录的方式分享出来。愿我们共同进步。
1. 坚守论文的概念框架,内容宁缺毋滥
我的理解是论文只有一个目的,就是把自己的研究清清楚楚,明明白白的讲给读者。写论文就像讲故事做ppt一样,需要有一个概念框架,用来约束你想讲的内容。只要把内容讲清楚了就OK了。当然设计一个框架不是一件简单的事情,需要突出论文的重点贡献,用不同的章节在篇幅限制以内,把最能够体现贡献的内容写出来。一旦这个框架安排好了,最好不要再做变化。把研究的内容写上去就可以了。如果在研究过程中有什么新的发现,最好不要轻易的决定把它放到论文里,因为那样会改变论文设计好的构架。而且如果每次有新东西就像放上去,这样研究容易跑偏,论文也走形了。最好是把它记下来,然后继续按照之前的计划完成论文。等事后有时间了再研究那些新的发现。最重要的是要认识一点:论文是看功劳不看苦劳的,绝不是写的越多越好。有时候多一个写一点可能导致整个论文结构分散,本来一篇可以被接收的论文就被拒了。
2. 突出一个重要的点,或几个相同量级的贡献
如果有课时间,我讲一些机器学习的内容。ppt第一页可以分为线性回归、逻辑回归、决策树主题。但我不会划分线性回归、正规方程、最小二乘等主题。因为前者是同级别的话题,所以观众很容易理解我要讲的就是这三种方法。后者正常方程和最小二乘法可以包含在线性回归中,观众说出来会一头雾水。你是想谈谈线性回归,还是想强调正规方程和最小二乘法的重要性?
观众在接收信息时,往往会试图找到关键点,即“你想解释什么”。写一篇essay也是如此,一篇essay应该尽可能突出一个重点。这个重点是论文的创新和贡献。例如,有人发明了一种算法,将此算法应用到别人的数据库中会得到比其他人更好的结果。那么论文中唯一应该强调的应该就是这个算法了,讲清楚原理和优缺点就结束了。
如果要编写多个贡献,它们应该具有相同的量级。例如,有人发明了一种算法,同时提出了自己的数据库。他在自己的数据库上应用了自己的算法,得到了很好的结果。所以论文中应该强调的是算法的原理和数据库的内容。
再举一个反例。例如,有人发明了一种算法,应用于其他人的数据库,以获得比其他人更好的结果。同时,他对数据预处理的想法略有不同。由于发明一个算法,在数据预处理中做出一些改变,往往不是一个层次的贡献,所以最好假设论文中没有预处理这种东西,用大部分篇幅来突出算法。在描述数据的章节中,简单地写下你如何进行数据预处理并给出原因。甚至不要抽象地提及它。反过来,如果用大量文字来突出预处理的好处,那么应该说明的算法篇幅就会被压缩,审稿人就容易产生疑问。“这个新算法我没见过,应该是创新,但是太粗糙了,我看不懂。还有,为什么这个孙子说预处理的好处这么多?这两件事应该是相互独立的。,为什么听起来他的算法没有这个预处理就不会得到这么好的结果?“如果讲故事的方式不符合观众的理解习惯,可能会造成这种混乱。
3、理论严谨完备
其实这点可以概括为第一篇文章的一个分支,在建立论文的概念框架时需要考虑。我认为一个理论的严谨性体现在它是否具有扎实的背景理论基础以及是否可以量化。架空理论肯定会受到质疑;无法量化的结论很容易被质疑其门槛在哪里。
(a) 您不能用经验或技术内容代替理论结论。
经验总结或技术性事物在理论框架中显得苍白无力。除非人类在这个领域还没有找到更合适的方法,这时候可以用业界普遍认可的方法代替。深度学习行业领军人物、李飞飞的高徒弟、CS231n的讲师之一安德烈·卡帕西曾经发表过一篇名为“训练神经网络的秘诀”的长博,其中谈到了33个技巧和注意事项。这些都是网络调整技巧,你可以在微博上发帖,但如果你写一篇论文,那可能是一场悲剧。(但这也不是绝对的,我在换方向之前看过一篇论文,论文是如何写论文的。论文准确地建议每章每段应该有几句到几句,每句大概是什么内容。) ..好像是雅思写作的模板,一度被业界视为“圣经”的东西,作者好像叫Marina,现在找不到了..)
什么是经验结论,我不能举个例子来。
(b) 不要写出无法量化的结论。
有时我在某个领域做一些研究,但找不到一个指标可以衡量这个结论的可行范围。这是一个不完整的结论。写的时候审稿人还会问,“你没有准确的定义~无法衡量~我们不知道它的可行范围和阈值在哪里~”等等。因此,最好在第一次构建理论框架的时候就找到衡量自己结论的指标,否则这种研究就是浪费时间,写不出来。
(c) 过于明显的结论可能不被认为是创新
应该就哪些研究被视为创新达成普遍共识。例如,闭路电视经常发现小偷。有一些检测方法可以自动检测是否有人打破了门窗或偷走了它们。然而,由于大多数动作是在夜间进行的,图像太暗而无法检测到。这时,A先生提出了一个理论,说可以通过将图像调亮来检测图像(例如,其实原理没那么简单),所以我写了一篇论文并投票。这可能是显而易见的结论。除非被忽视的结论背后有更深层次的理论支持,否则这东西可能没用。
(d) 不要写你不知道的东西(废话)
写不是很清楚或不知道如何解释或比较模糊的东西是一种禁忌。这种内容不仅占用空间,而且还为论文减分。比如我上面写的3a里,我不能说清楚“体验内容”指的是什么,写下来。这是审稿人把握把手的机会。
4. 假设审稿人什么都不懂
了解了论文的具体内容后,接下来的问题就是如何写出这些内容的突出显示。说明的内容要恰当。作为我们组的博士后,西湖大学的教授向我强调了两次:在写论文之前,要假设审稿人什么都不懂。当然,这并不是说每一个专业词汇都需要解释,而是每一个引入的概念原理,尤其是对自己研究有帮助的部分,都要解释清楚。比如我们需要用拉普拉斯金字塔做研究,然后对金字塔进行变换。在这部分,每层图片的频率和大小都会发生变化。然后我们需要讲一下原始拉普拉斯金字塔的功能和结构,以及如何对原始金字塔的哪一层进行变换。结果是一个新的金字塔形状和一个新的。频率是多少。这样,核心内容一步步清晰的表达给审稿人,让对方了解自己研究的目的。如果有直观的展示图片,还应该说明哪里可能会引起误解。比如高斯底层的分辨率很小(以2^n次幂的方式呈指数下降),为了看清图片内容,必须放大。所以为了避免误会,有必要提一下:那些模糊的图片,都是对原图放大2^n倍,才能看清内容。要不,审稿人看看,嗯?这层图像不应该呈指数减少吗?怎么看起来和原图一样大?你做了什么来处理它吗??还有很多。
5.严谨没有想象
科技论文不同于散文,只要把研究描述清楚就行。没有必要为了追求文字的美而牺牲文章的严谨性。严谨至少体现在两个方面:措辞和数学符号。
(一种) 使用准确的词
一般来说,一个研究领域,除非是开创性的工作,否则就会有足够的教训。看了很多前人写的东西,应该对用什么词汇来描述某个实体或功能有一定的了解。保持行业人员达成的这种共识将有助于使您的文章为他人所接受。而不是像写散文那样使用似是而非的词汇。
例如,如果我想表达“拉普拉斯金字塔将图像分解为由超参数 k 控制的多个频率层”。
“拉普拉斯金字塔将图像分解为由超参数 k 控制的多个频率层。”
“拉普拉斯金字塔将图像转换为由超参数 k 控制的多个频率层。”
一般来说,第一句比较好,因为分解明显比转好。更准确地说,因为读者不知道如何转向。是不是复制了很多层?还是有很多层叠加?分解这个词虽然扼杀了想象力,但它突出了严谨。这是纸。在《硅谷来信》中,吴军提到了写论文最忌讳的4个动词,分别是:make、have、do、、、、,最后一个忘记了(捂脸)。原因是这些词的含义非常广泛,一方面让这篇文章容易出现歧义,另一方面又显得作者不专业。
(b) 符号统一,不得有误
论文中的符号,尤其是数学符号,必须统一贯穿全文,包括流程图中的表述和图片的标题,否则直接判死刑。改变一个符号不再是原来的意思。这包括在论文中充当符号的专有名词的大写,并且连词必须严格统一。