高效阅读英文文献的方法总结（二）

2024-06-25 08:50:37

前言：

在上一篇《CV方向的高效阅读英文文献的方法总结》中介绍了如何阅读一篇论文，相信不少读者认真践行后已经具备卸载翻译软件、直接硬刚原论文、几小时读完一篇论文的能力了。

而在本篇将介绍如何阅读大量的论文，这一篇更多地是介绍思想，而不是具体方法。

transformer在这两年遍地开花，天天都可以看到各个公众号对新出的transformer论文的推送。对于计算机视觉的人来说，难免会是另一种痛苦--不得不去了解，但又没必要全了解。对刚入门的小白来说，更是难受兼迷茫，因为除了每年出现的大量论文需要了解或深入阅读，还有以往的很多论文需要学习。

在本文将谈一谈我对如何阅读计算机视觉论文的看法。

首先，给大家看一个问题。

该问题下有相当一部分大佬给出了关于能否做attention的理论解释，提问者也根据这些理论解释给出了他的理解，对于理论解释的合理性，我才疏学浅无法置评。

但我想给出几个例子作为我的观点：

1)在AlexNet论文中，作者提出了局部响应归一化 (LRN )，并搭配ReLU会有一个点的提升，并给出了它的理论解释，但在VGG论文中却表示，LRN并不能提升VGG模型性能。

2)在ResNet中作者提出残差连接，并认为它能缓解梯度消失的问题，但后面何凯明提出BN已经缓解了梯度消失的问题，残差连接仍然很有效果。现在网上也仍在讨论ResNet到底解决了什么问题。

3)在GoogLeNet（即Inception v1）中，作者提出了两个辅助分类器，即在网络中间增加两个输出口，但在Inception系列的第三篇论文中就提出这玩意没用，取消了。

这样的例子还有不少，究其原因，还是在于神经网络不具备可解释性。

计算机视觉这十年来涌现了很多很多的论文，论文基本的形式是提出新模型或新模块或新方法，并解释这么设计的原因，思路，解决的问题。

可以肯定的是，这些模型或模块或方法都是有一定的效果，然而，它产生效果的真正原因真的就是作者给出的解释吗？

答案是不一定的，因为作者也是在主观理解，只能证明提出的模型或模块或方法是有效果，而并没有客观的东西来证明它的理论是正确的。

此外，一个完整的模型的最终效果是由数据集、数据预处理、神经网络、后处理和评价指标共同产生的，而大部分的论文只涉及到其中的一部分。例如，提出某个新模块加在了神经网络的某部分，而它实际上对于数据预处理部分，以及在其它一些模型的设计细节上，并不与baseline相同，因此，它虽然与baseline比较有一点点提升，但并不能证明它的有效性。

说了这么多，到底想表达什么意思呢？

我想说的是，对于现在层出不穷的transformer论文，没有必要把每一篇论文都当作是公理看待，而是保持辩证的思维去阅读。

照这么说来，每一篇都要保持不确定性，那岂不是很荒诞。

实际上，这仅仅针对新出的论文，对于以往的经典论文，基本可以当成是确认有效的模型或网络或方法。

例如残差连接，基本成为了标配，例如ResNeXt中提到的“split-transform-merge”的设计思想，在无数的模型中都有体现，例如SE模块，BN归一化方法等。它们都经过了时间和无数后来者的检验，证实了它们的有效性。

前面我们提到，计算机视觉由于不具备可解释性，模型或模块的设计、方法的提出都是基于作者的主观理解。但实际上，很多论文之所以成为经典论文，关键在于它们时间和后来者证明了它们的有效性。

因此，我们可以把这些经典论文中提到的设计思路、改进思路，提出的观点，当成一个我们自己设计模型的理论基础。

这与前面讲的作者的主观理解不一定就是真正产生效果的原因并不矛盾，因为这是以结果为导向的：它有用，经过了几年，大家还在用它，从而把作者对它的主观理解当成是它的理论基础，这是目前的主流做法，但只要记得，它的理论有可能有被推翻的一天。这样的做法就没毛病。

用一句话来总结，对于过往的论文，可以看它的论文引用数量，较多的可以认真看一看。而对于新出的论文，保持不确定的态度去了解它们的设计思想、创新方法。这是因为它们大部分论文都只是过眼烟云，过了发出的那一年，就没人使用它们，而留下来的、过了几年大家还在用的，才是真正有效的设计。

后记

随着计算机视觉发展至今，论文数量每年都在大幅度增加。

如神经网络归一化，就出现了BN、LN、GN、IN、FRN、CmBN等众多方法；

如数据增强，出现了Cutout、Random Erasing、Mixup、Hide-and-Seek、CutMix、GridMask、FenceMask和KeepAugment等方法；

如注意力机制，出现了RA、BAM、CBAM、SE、Non-Local、DANet、CA等方法；

如特征金字塔，出现了ASPP、FPN、PANet、RFB、ASFF、FPT、YOLOF等方法；

如一系列经典的神经网络，轻量化的神经网络等；

此外，还有很多很多。

这些内容没必要每一篇都去细看，但不了解是万万不行的。

以神经网络归一化为例，只了解BN可以吗？是不是设计或选取网络的时候都不管三七多少，直接使用BN就完事了？以特征金字塔为例，只了解FPN可以吗，直接使用FPN就完事了？特征提取网络直接使用ResNet就完事了？

CV技术指南，其核心就在于将这些内容逐一总结，让读者以最轻松、最高效、最快速的方式了解这些方法，从而快速进入自己的研究状态。

如何高效阅读文献和创新构建知识体系

谈到高效阅读,有人可能会疑惑,不就是快速阅读吗? 有什么可谈的? 完全不然.阅读是科研人员每天最常做的事情之一,非常值得采用系统工程的方法构建完整的阅读和创新能力. 阅读分为三种,包括消遣阅读.学习阅 ...
朗读、默读、视读——高效阅读的关键是什么？

阿猫读书 2020-08-21 以下文章来源于罗文益 ,作者罗文益罗文益读书,读事,读人. 我以前曾道听途说过一个观点,那就是真正高效的阅读,是去除了"大脑里面跟着读"的惯性, ...
1分钟阅读2000字还不影响理解？高效阅读训练方法，一学就会

1分钟阅读2000字还不影响理解？高效阅读训练方法，一学就会
CVPR2020论文解读—华为高效轻量级网络GhostNet, 性能超越谷歌MobileNetV3

AI研习图书馆,发现不一样的精彩世界论文解读华为诺亚方舟实验室提出的新型端侧神经网络架构GhostNet,在同样精度条件下,模型速度和计算量均少于此前SOTA算法,值得一看.GhostNet论文已 ...
李源的《给大忙人的高效阅读课》读后感

这是书邦人的第 68 篇原创文章如果没有读书方法的主题阅读任务,我就不会打开李源的<给大忙人的高效阅读课>.从书名上看像一本烂书,当我把自己的读书经历和他的方法结合起来阅读时,才发现 ...
利用U-Net上下文融合模块实现高效的手掌线分割

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
牛人看外文文献的方法（二）

科研牛人二告诉研究生怎么看文献,怎么写论文. 一.先看综述先读综述,可以更好地认识课题,知道已经做出什么,自己要做什么,,还有什么问题没有解决.对于国内文献一般批评的声音很多.但它是你迅速了解你的研 ...
阅读英文文献的诀窍，就在这里！

阅读英文文献的诀窍，就在这里！
读研or读博攻略 | 如何快速且有效的阅读英文文献

全文共计4388字,预计阅读时长11分钟 "认识你自己" 这是刻在古希腊阿波罗神殿上流传最广.影响最深的一句名言. 这也是最难的问题,尤其是对刚刚入学的同学来说,认识硕士/博士学习 ...
掌握这个方法，英文文献阅读效率1小时抵10小时！

刚刚接触英文文献的你是不是会遇到这样的疑惑? (对号入座) 01 好不容易嚼透了各个英语单词但是连起来却不懂讲的是什么? 还经常读了后面,忘了前面...... 02 看了别人文献里各种" ...
买了书不会看？四个方法让你高效阅读

昨天4月23日是读书日,你是否也买了很多书? 今年我没有给大家推荐书单,因为我觉得推荐书籍并不能解决大家的问题,毕竟在这个信息时代,只要你具备一点搜索技能,你都可以从各种渠道获取到你需要的书单. 但是 ...
研究生如何高效阅读文献？这篇文章值得收藏

来源:募格课堂(ID:mugeketang) 编辑:学长博士的苦只有博士知道,当别人趴被窝时,博士在写论文:当别人在刷微博,刷抖音,刷快手时,博士在看论文:当别人在熬夜玩手机看电视时,博士在伏案夜读 ...
如何高效阅读一本书：中国人自己的读书方法

如今有关读书方法长长的书单里,放眼望去几乎都是外版书,然而作为一名中国人,那些方法真的是适合我们的吗?想必大家都有这个疑惑,同一本书,懂得方法的人读了,可以获得智识,应付环境:反之,不懂方法的人,读了 ...
一篇文章7个方法，掌握高效阅读的技巧

培养孩子的阅读习惯和阅读能力, 从而达到高效阅读,是需要一个长期的过程. 家长在这个过程中的作用非常重要. 而一提到"阅读能力", 家长们总会下意识地与考试中的阅读理解联系起来. ...
小学1-6年级阅读考核标准和10个高效阅读方法

千课万人 3月7日 "读书之法,在循序而渐进,熟读而精思.--朱熹" 今天我就为大家带来一到六年级的阅读考核标准和10个高效阅读的方法,快来看看吧! 01 1年级阅读考核标准 1. ...

高效阅读英文文献的方法总结（二）

相关推荐