青出于蓝而胜于蓝，超越MixUp、CutMix的样本混合数据增广新算法FMix

2024-08-05 14:21:48

深度学习实践中，数据的增广有很多种方法，比如在计算机视觉任务中除了常规的对单样本进行缩放、颜色扰动、旋转、镜像等外，也可以通过对两个样本进行混合，生成新的虚拟样本训练集。这类方法被称为样本混合数据增广（Mixed Sample Data Augmentation，MSDA），比如MixUp。

MixUp 方法公式：

通过对两个样本标签和输入向量的加权，生成新的虚拟训练样本。

前天新出的论文Understanding and Enhancing Mixed Sample Data Augmentation，来自英国南安普顿大学的研究学者从信息论的角度试图理解这种方法的原理，并提出了新的数据增广方法FMix，在多个数据集上均表现SOTA。

FMix是在CutMix的启发下对方法的推广。

我们先看看看CutMix做了什么。

Mixup是在全图上进行加权，CutMix是在图像上取方块的位置再加权混合像素，CutMix取得了更好的效果。

作者们提出的FMix则是对图像按照高频和低频区域进行二值化区分区域，然后使用此Mask进行分像素的加权。

如下图：

论文的实验在图像分类（CIFAR-10、CIFAR-100、Fashion、ImageNet）、文本分类（Toxic）等任务中显示，FMix取得了一致的性能提升，是目前最先进的样本混合数据增广方法。

论文中还进行了理论分析，作者也已经将代码开源了，欢迎大家试用！

论文地址：

https://arxiv.xilesou.top/pdf/2002.12047.pdf

代码地址：

https://github.com/ecs-vlc/FMix

吊打一切现有版本的YOLO！旷视重磅开源YOLOX：新一代目标检测性能速度担当！

作者丨happy 编辑丨极市平台极市导读 YOLO系列终于又回到了Anchor-free的怀抱,不用费劲心思去设计anchor了!旷视开源新的高性能检测器YOLOX,本文将近两年来目标检测领域的各个 ...
【YOLOX】新一代 anchor-free 目标检测器，吊打一切！

OLOX 介绍 YOLOX 在 YOLO 系列的基础上做了一系列工作,其主要贡献在于:在 YOLOv3 的基础上,引入了「Decoupled Head」,「Data Aug」,「Anchor Free ...
赛尔笔记 | 自然语言处理领域的数据增广方法

作者:哈工大SCIR 李博涵 1.摘要本文介绍自然语言处理领域的数据增广方法.数据增广(Data Augmentation,也有人将Data Augmentation翻译为"数据增强&qu ...
基于深度学习的数据增广技术一览

加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
数据格式规范，这些方法的格式你都get了吗？

正确的数据格式是分析的基础,一直以来大家问得最多的就是数据格式的问题.什么样的格式才能分析?为什么我的数据显示格式不对?怎么批量添加标签?针对这样那样的问题,今天我们就来总结一下. 一.格式规范 1. ...
小样本学习及其在美团场景中的应用

美团的各个业务有着丰富的NLP场景,而这些场景中模型的构建需要很多的标注资源,成本很高.小样本学习致力于在数据资源稀少的情况下训练出比较好的模型.本文从主动学习.数据增强.半监督学习.领域迁移.集成学 ...
[综述类] 一文道尽深度学习中的数据增强方法（上）

00 什么是数据增强在深度学习项目中,寻找数据花费了相当多的时间.但在很多实际的项目中,我们难以找到充足的数据来完成任务. 为了要保证完美地完成项目,有两件事情需要做好: 1.寻找更多的数据: 2. ...
【技术综述】深度学习中的数据增强方法都有哪些？

很多实际的项目,我们都难以有充足的数据来完成任务,要保证完美的完成任务,有两件事情需要做好:(1)寻找更多的数据.(2)充分利用已有的数据进行数据增强,今天就来说说数据增强. 作者 | 言有三编辑 ...
【每周CV论文推荐】 CV领域中数据增强相关的论文推荐

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 数据增强在每一个深度学习项目中都是必要的操作 ...
青出于蓝而胜于蓝—王献之临终前的这幅字，超越了父亲！

王献之<地黄汤帖>,又名 <新妇地黄汤帖>,现存墨迹是唐人墓本(又传为米芾临本).<地黄汤帖>用笔外拓,笔画圆腴而纵逸,极富节奏感.起始" 新妇&quo ...
张鹤伦相声，真是青出于蓝而胜于蓝，太逗了！

张鹤伦相声，真是青出于蓝而胜于蓝，太逗了！
张鹤伦郎鹤炎，损人都是一套一套的，真是青出于蓝而胜于蓝

张鹤伦郎鹤炎，损人都是一套一套的，真是青出于蓝而胜于蓝
青出于蓝而胜于蓝！姜夔化用杜牧4首诗写妙词，如今年年入选课本

千年文坛,出现的高手和佳作实在太多.后世之人想要写出脍炙人口的作品,其实难度是很大的.毕竟珠玉在前,很多内容和题材都被前人写得差不多,想要推陈出新谈何容易. 那么在这种情况下有没有捷径可走呢?别说还真 ...
小欧与大欧丨青出于蓝而胜于蓝

伟大的物理学家牛顿有句话说:"如果说我看得比别人更远些,那是因为我站在巨人的肩膀上."在任何领域若有高人.名师指点,就等同于助推剂,首先保证了高起点.中国传统文化的家学渊源尤为重要 ...
没有文明不伟大（三）：尚武的古巴比伦神话，青出于蓝而胜于蓝

公元前4000年到前2250年之间,底格里斯河和幼发拉底河流经的今伊拉克两河流域诞生了人类最早的文明之一--古巴比伦文明.据大量考古发现证明,约在公元前4000年,居住在两河流域的苏美尔人就有了较为发 ...
微软Surface Laptop 4评测：青出于蓝而胜于蓝

前言:2021年的Surface,主题是强化性能 "七年多的时间过去后,原本可能只是想起到"样板机"作用的Surface,如今却早已成为市场上与各大PC品牌分庭抗礼的生力 ...
永瑆临《赵孟书卷二十四赞》，青出于蓝而胜于蓝，赶超赵孟

作为"清四家"之一的成亲王永瑆,在书法史上留下了浓墨重彩的一笔,他虽然是王爷身份,但是在政绩上平平,唯有书名传世,他的书法偶像众多,但是赵孟是他一直不变的偶像,在学习赵体书法上用功 ...
食叶草不是鲁梅克斯，是青出于蓝而胜于蓝，千万不要再被蒙骗！

食叶草是我国引进的鲁梅克斯 K-1 酸模与我国野生巴天酸模回交选育生成的多年生蓼科酸模属草本植物.食叶草在我国新疆.河北.河南.山东.山西.陕西.甘肃.北京.天津.浙江.江西.江苏.广东.广西.吉林. ...

青出于蓝而胜于蓝，超越MixUp、CutMix的样本混合数据增广新算法FMix

相关推荐