更少的标签，更好的学习，谷歌半监督学习算法FixMatch

2024-05-25 20:47:12

本文向大家推荐谷歌前段时间发布的论文 FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence ，该文提出了新的简单又有效的半监督学习算法FixMatch，结合伪标签（pseudo labeling）和一致性正则化（Consistency regularization）两种半监督学习方法，取得了显著的效果提升。

该文作者信息：

作者均来自谷歌研究院。

半监督学习算法，即利用少量有标签数据和大量无标签数据的机器学习算法，最近获得了大量关注。

如何利用无标签数据是半监督学习的关键，一种常见的学习策略，使用在少量有标签数据中训练的模型对大量无标签数据进行预测，使用预测的结果标签重新训练模型。该类方法被称为伪标签。

该文提出的方法，用下面这张图即可完全概括：

首先，使用有标签数据训练Model；

然后，对于无标签数据，将其进行弱数据增广（比如反转、拉伸、缩放等），然后交给Model预测，对于置信度高过某阈值的样本，使用one-hot编码打上伪标签；

最后，使用上述伪标签数据训练Model，此时对数据进行强数据增广（无监督数据增广UDA、Mixup等），使得训练后的模型对强数据增广的数据作出的预测与伪标签匹配，使用标准的交叉熵损失函数。

下表为FixMatch方法与其他半监督学习算法的比较：

下图为作者在CIFAR-10、CIFAR-100、SVHN数据上半监督学习分类结果：

相比以往的State-of-the-art，FixMatch取得了显著的精度提升，在仅使用40个标签数据（每类4个样本）时于CIFAR-10数据集上取得了88.61%正确率，在使用250个标签数据（每类25个样本）时取得了94.93%正确率。

在STL-10数据集上，同样取得了精度提升：

作者又做了一个极端的实验，CIFAR-10数据集每类仅用 1 个标签样本，仍然取得了78%正确率。

作者针对学习策略、数据增广策略等做了很多消融实验，欢迎阅读原论文。

总之，该文提出的方法简单又有效，将有助于半监督学习投入更多实用场景，代码已开源，欢迎大家继续研究。

论文地址：

https://arxiv.org/abs/2001.07685

代码地址：

https://github.com/google-research/fixmatch （官方）

https://github.com/kekmodel/FixMatch-pytorch （非官方）

赞 (0)

终于有人把监督学习、强化学习和无监督学习讲明白了

导读:本文将讨论监督学习.无监督学习和强化学习这三种类型的机器学习. 作者:塞巴斯蒂安·拉施卡(Sebastian Raschka).瓦希德·米尔贾利利(Vahid Mirjalili) 来源:华章科 ...
机器都能监督自己学习，你为什么不行？

学习是人类一生的使命.谁成想,机器也同样悲惨地被人类赋予了这个使命.于是,参照人类大脑利用深度神经网络来解决特征表达的运作方式,机器从此走上了"深度学习"的路,一去不复返..... ...
机器学习简介

随着大数据的爆发,以及计算机算力的加强,以机器学习为代表的人工智能领域逐渐火热起来.机器学习有以下几个构成要素 1. 数据,大数据是必备条件,是机器学习的输入信息,基于大数据,才使得模型的训练效果更好 ...
更少的测试，更多的学习：重新构想教学评估

远程或混合学习计划,这些不同以往的学习方式的兴起(未来或将成为常态),意味着如何了解学生的学习情况比以往任何时候都更加重要.作为老师,需要知道学生的进步,而不仅仅是成绩单上的数字. 比起进行单元结束考 ...
如何做得更少，成就更大

在职场上,列 To Do List 成了基本素养,不会列行动项清单,或者列的太少,就意味着工作不饱和. 当我们掌握了这个神技后,待办清单整个屏幕都放不下,即使996,007,工作还是越来越多.当投入越 ...
房子要实用也要气派，怎么花更少钱建更好的房，这7款户型告诉你

奋斗了那么久,终于有能力在城里面扎根之后,再在老家给爸妈盖一栋别墅养老,当然不完全是为了给爸妈养老用的,还掺杂了很多其它的想法.如果能力不错的话,可以盖一栋稍微气派些的别墅! 赚钱为了养家,为了更好的 ...
管道升级 | 渗漏更少，水流更大，全屋用水更舒心

升级管道配件,水流速度对比在装修过程中,我们会遇到各种各样的"居家痛点".比如:厨房在洗碗,卫生间在洗澡,一般离主管道较近的管道可以享受水流均匀,而离得较远的,就会水流变得很小, ...
更少，但更好！

亲爱的们, 我回来了, 感谢大家的耐心等待! 在放空自己的日子里, 时间过得特别缓慢, 生活好像出现了空档, 绵远而悠长- 休假结束,各种忙碌纷至沓来.如何应对拥挤不堪的工作与生活,在繁华缤纷中过 ...
专访：李杰（水晶苍蝇拍） “投资不是比哪一个方面犀利到极致，而是看谁的弱点更少、理解更系统，这才是投...

"投资不是比哪一个方面犀利到极致,而是看谁的弱点更少.理解更系统,这才是投资人自我修养的重点."本期<红周刊>.雪球网与手机腾讯网合作的投资人物专访栏目嘉宾李杰先生(雪 ...
【科研简讯】基于渲染对比学习和半监督学习的三维超声卵巢卵泡自动分割

MICS科研简讯第三十九期研究背景介绍今天为大家介绍一篇基于深度学习的三维超声卵巢卵泡自动分割的文章.三维超声成像是临床医师用于检查女性生殖器官(如卵巢)最常用的影像工具.卵巢功能的评价.卵泡的计 ...
掌握方法论，让你在工作生活学习当中产生更少失误

正心正举,与智者同行
我们从小很少接触到商业的课程学习，以至于长大后更希望追求稳定

我们从小很少接触到商业的课程学习，以至于长大后更希望追求稳定