神经网络Drop大法，真香！

2024-04-20 12:04:10

快速获得最新干货

drop方法从一开始提出的时候，就用来当作正则化使用，提升模型的鲁棒性。近年来drop方法被玩出花来，drop方法有两种明显的趋势:

随机drop-> 自适应drop

像素级drop -> 区域级drop

本文主要介绍Dropout、DropBlock、AttentionDrop和TargetDrop四篇文章。

Dropout

在2012年，Hinton提出Dropout。当一个复杂的前馈神经网络被训练在小的数据集时，容易造成过拟合。为了防止过拟合，可以通过阻止特征检测器的共同作用来提高神经网络的性能。

Dropout可以作为训练深度神经网络的一种trick供选择。在每个训练批次中，通过忽略一半的特征检测器（让一半的隐层节点值为0），可以明显地减少过拟合现象。这种方式可以减少特征检测器（隐层节点）间的相互作用，检测器相互作用是指某些检测器依赖其他检测器才能发挥作用。

Dropout说的简单一点就是：我们在前向传播的时候，让某个神经元的激活值以一定的概率p停止工作，这样可以使模型泛化性更强，因为它不会太依赖某些局部的特征，如图所示。

对于feature map来说，相当于随机mask掉像素。

DropBlock

Dropout的主要缺点是它随机drop特征。虽然这对于全连接层是有效的，但是对于卷积层则是无效的，因为卷积层的特征在空间上是相关的。当这些特性相互关联时，即使有dropout，有关输入的信息仍然可以发送到下一层，这会导致网络overfit。为了更好地规范卷积网络，引入DropBlock方法，这是一种结构形式的dropout，对卷积网络的正则化效果好。在DropBlock中，一个block中的features，即feature map中的的一个相邻区域，会一起被drop掉。

AttentionDrop

现有的正则化方法如Dropout和DropBlock从输入特征图中删除单元来防止过拟合。然而，它们要么忽略了特征的空间语义信息，要么不能自适应物体的形状区域。而AttentionDrop可以自适应物体的形状和位置来降低所选区域的激活值。另外，用soft mask代替传统的binary mask。

Adaptive Mask

AttentionDrop首先提出了一个简单的adaptive mask。对feature map的每个像素值进行排序，选择最大百分位值来确定mask的位置。定义中像素值最大的百分比为，我们将shape mask定义为:

Soft Mask

之前的大多数drop方法大多数使用binary mask，AttentionDrop使用soft mask。如adaptive mask所述，shape mask偏向于高激活区域，采用min- max normalization对当前特征图进行归一化:

TargetDrop

TargetDrop类似于AttentionDrop + DropBlock。

Target Channels

TargetDrop第一步得到不同通道的重要程度，类似于SENet的做法。使用全局平均池将每个特征图的局部信息聚合成通道方向的向量，这个操作可以定义为:

为了进一步确定通道之间的依赖关系，通过两个FC层得到不同通道的注意力。

然后选择topk个最重要的通道进行mask。

Target Regions

TargetDrop考虑到图像像素值的连续性，选择具有最大值的位置(a, b)，并将其周围的k×k区域丢弃。可以定义为:

总结

TargetDrop和AttentionDrop的区别:

1. TargetDrop的soft value通过attention module学习得到的，而AttentionDrop的soft value通过统计计算得到的

2. TargetDrop是区域级的drop，而AttentionDrop是像素级的drop

学习得到的soft value，自由度更高，区域级的drop得到的结构语义信息更强。但是感觉AttentionDrop和TargetDrop没有在Imagenet数据集上实验，说服力不够

感觉Drop大法都快被玩烂了，我能想到的改进是TargetDrop的基础上再加一个DCN，学习kxk的offset进行mask，说不定就有人做了

Reference

[1] Dropout: A Simple Way to Prevent Neural Networks from Overfitting

[2] DropBlock: A regularization method for convolutional networks

[3] AttentionDrop for Convolutional Neural Networks

[4] TargetDrop: A targeted regularization method for convolutional neural networks

谷歌大脑提出DropBlock卷积正则化方法，显著改进CNN精度

昨天arXiv新上一篇被NIPS2018会议接收的论文<DropBlock: A regularization method for convolutional networks>,作者为 ...
细节满满！理解对比学习和SimCSE，就看这6个知识点

转载自 | PaperWeekly ©PaperWeekly 原创 · 作者 | 海晨威研究方向 | 自然语言处理 2020 年的 Moco 和 SimCLR 等,掀起了对比学习在 CV 领域的热潮 ...
PP-YOLO何许模型？竟然超越了YOLOv4

重磅干货,第一时间送达 PP-YOLO评估显示出更快的推断(x轴)和更好的准确性(y轴) PP-YOLO评估指标显示出比现有的最新对象检测模型YOLOv4更高的性能.但是,提出者百度却谦虚的声明: 无 ...
bert之我见-attention篇

[NLP.TM] 我想现在NLP领域中,不知道bert的已经少之又少了,而bert的讲解文章也已经有了很多,这里我谈一下我最近学习得到的理解.事先说明,对bert和transformer完全不懂的人看 ...
又是Dropout两次！这次它做到了有监督任务的SOTA

关注NLP新进展的读者,想必对四月份发布的SimCSE印象颇深,它通过简单的"Dropout两次"来构造正样本进行对比学习,达到了无监督语义相似度任务的全面SOTA.无独有偶,最近 ...
Dropout也能自动化了，谷歌大神Quoc Le等人利用强化学习自动找寻模型专用Dropout

阅读大概需要5分钟 Follow小博主,每天更新前沿干货在机器学习领域里,Dropout 是一个较为重要的方法,其可以暂时丢弃一部分神经元及其连接,进而防止过拟合,同时指数级.高效地连接不同网络架构 ...
重磅！就在刚刚，吊打一切的 YOLOv4 开源了！

Tips ◎作者系极市原创作者计划特约作者Happy 欢迎大家联系极市小编(微信ID:fengcall19)加入极市原创作者行列早上刷到YOLOv4之时,非常不敢相信这是真的! paper:http ...
Cascade R-CNN升级！目标检测制霸COCO，实例分割超越Mask R-CNN

前天,arxiv上新出一篇论文<Cascade R-CNN: High Quality Object Detection and Instance Segmentation>,目标检测算法 ...
试驾全新雅阁：五星轮毂+流水灯，跟上潮流的“本田大法”真香？

虽说目前广汽本田深陷"芯片荒"的影响,但在9月份依旧砍下72053台的销量,相比于8月有了明显提升,其中雅阁销量达到了19907台,前三季度累计销量133591辆,有机会再次冲击年 ...
真香！我在法国知名厨艺院校学厨艺，好吃又好玩儿！

各位小伙伴们好,我的笔名是甄诚,曾经就读于首都经济贸易大学市场营销专业,在19年10月份来到法国巴黎蓝带厨艺学院开始正式学习法餐,今天我就来和大家分享一下我为什么到法国学习法餐以及在法国蓝带的就读体验 ...
调白菜饺子馅，最忌放盐杀白菜水分，大厨教会你正确做法，真香

调白菜饺子馅，最忌放盐杀白菜水分，大厨教会你正确做法，真香
家常烙饼好吃有诀窍，掌握这三种方法，层次分明，外皮酥脆，真香

家常烙饼好吃有诀窍,掌握这三种方法,层次分明,外皮酥脆,真香家常烙饼好吃有诀窍,掌握这三种方法,层次分明,外皮酥脆,真香展开
炖猪蹄时，切记“3不放”的窍门，猪蹄Q弹软烂，不腥不油腻，真香

炖猪蹄时，切记“3不放”的窍门，猪蹄Q弹软烂，不腥不油腻，真香
这6个还没被发现的好用国产APP，真香

相信大家平时都用过很多非常好用的APP,但是下面非常小众的好用国产APP,你用过吗?接下来就带各位一探究竟,希望可以帮到你哦! 1.学习强国国家出品的学习类APP,党员同学们想必是人手一个,视频版块 ...
这些车上的东西都是假的！但买的人却觉得真香！

假货是我们坚决需要抵制的假货意味着知识产权收到侵犯意味着质量差汽车上同样有"假货" 就问你够不够唬人? 我们在马路上会看到部分车型为了设计而专门在后杠上设置有&q ...
华为EMUI10带来的两个新功能：拼图和创作影片，用了下，真香！

华为EMUI10带来的两个新功能：拼图和创作影片，用了下，真香！
吃了半辈子鸡蛋，这做法头一次见，很少见的经典老菜，真香

今天要来跟大家分享的是一道即将失传的传统老菜,水炒鸡蛋.做这道水炒鸡蛋是不需要放一滴油的,非常适合减肥的朋友吃.而且这道水炒鸡蛋的做法特别简单,做出来之后味道特别鲜香,营养特别丰富.最重要的是这道水炒 ...

神经网络Drop大法，真香！

TargetDrop类似于AttentionDrop + DropBlock。

相关推荐