迁移学习中的负迁移:综述

更多技术干货第一时间送达

导读

迁移移学习(TL)试图利用来自一个或多个源域的数据或知识来促进目标域的学习。由于标记成本、隐私问题等原因,当目标域只有很少或没有标记数据时,它特别有用。

不过,TL的有效性并不总是得到保证。负迁移(NT),即源域数据/知识导致目标域学习性能下降,是TL中一个长期存在且具有挑战性的问题,文献中提出了各种克服负迁移的方法。本文从源数据质量、目标数据质量、域差异和集成算法四个方面对近100种对抗NT的方法进行了分类和回顾,填补了这一空白。本文也讨论了相关领域的NT,如多任务学习、多语言模式和终身学习。

今天介绍的是华中科技大学伍冬睿教授团队关于迁移学习中的负迁移领域进行的一个综述。虽然这篇综述的主要内容讲述的是迁移学习与负迁移的研究进展,然而将迁移学习应用于脑机接口、脑电数据处理时也必须考虑到训练和测试样本往往来自不同分布的问题。关于脑机接口中的迁移学习综述可以查看:《华中科技大学伍冬睿教授:非侵入式脑机接口中的迁移学习综述(2016-2020)》、《伍冬睿教授:脑机接口中迁移学习的完整流程》、《脑机接口中的流形嵌入知识迁移学习》等。
传统机器学习的一个基本假设是训练和测试数据来自同一个分布。然而,在 现实应用中这个假设往往不能满足。比如,两个图像数据库可能是用不同的相机在不同光照条件下采集的;脑机接口中的被试往往具有很大的个体差异。所以,从训练集上获得的模型在测试集上的泛化能力往往不好。
一个直观的解决办法是重新采集跟测试集样本分布相同的大量带标注样本,然后从中训练一个有监督机器学习模型。然而,现实应用中并不能总是获得这样的大量带标注样本,比如因为标注成本高、隐私考虑等。
更好的解决办法是使用迁移学习,即使用源域的数据或信息来帮助目标域的学习。这样,目标域只需要很少或完全不需要带标注样本。
然而,迁移学习并不总是有效的,除非其基本假设都得到满足:
  1. 源域和目标域的学习任务相似或相关;

  2. 源域和目标域数据分布比较接近;

  3. 存在一个源域和目标域同时适用的模型。

当这些假设不满足时,负迁移就会产生,即使用源域的数据或知识反而会让学习性能变差,不如直接用目标域的数据进行训练,如下图所示:
可靠的迁移学习需要同时考虑3个问题:
  1. 迁移什么?

  2. 如何迁移?

  3. 何时迁移?

然而大多数迁移学习研究只考虑了前2个问题。

尽管负迁移是个很常见和严重的问题,人们也提出了很多克服负迁移的方法,但是目前并不存在关于负迁移的详尽的综述。研究人员在最近的这篇综述文章里填补了这个空白。
研究者从4个方面系统性地归类和总结了近100种不同的克服负迁移的方法:源域数据质量,目标域数据质量,域间差异,集成性的算法。下图对上述提到的4个方面进行了概况:

更多具体的内容,可以查看对应的文章。

论文信息

Overcoming Negative Transfer: A Survey

编辑:邹思

(0)

相关推荐

  • TPAMI2021:基于视频的面部微表情分析综述与微-宏表情数据集发布

    作者丨孙国荃 编辑丨极市平台 极市导读 本文的工作提供了一个全面的综述,重点聚焦在微表情检测和识别相关的计算算法,以及用于构建自动检测与识别系统的图像和视频特征,并发布了一个新的数据集,称为微表情-宏 ...

  • 迁移学习——入门简介

    一.简介 背景:现如今数据爆炸: 对机器学习模型来说要求快速构建,强泛化 对于数据来说,大部分数据没有标签 所以收集标签数据和从头开始构建一个模型都是代价高昂的,需要对模型和带有标签的数据进行重用 传 ...

  • 【总结】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

    有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过的技术综述类文章,也欢 ...

  • 论文写作经验分享(笔者完成论文后的总结)

    论文写作经验分享(笔者完成论文后的总结)

  • 目标检测中的不平衡问题综述

    今天跟大家推荐一篇前几天新出的投向TPAMI的论文:Imbalance Problems in Object Detection: A Review,作者详细考察了目标检测中的不平衡问题(注意不仅仅是 ...

  • 什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案

    机器之心报道 参与:魔王 什么是小样本学习?它与弱监督学习等问题有何差异?其核心问题是什么?来自港科大和第四范式的这篇综述论文提供了解答. 数据是机器学习领域的重要资源,在数据缺少的情况下如何训练模型 ...

  • 外语学习中的母语迁移

    2020-12-31 14:01:31 来源:中国社会科学报国家社科基金专刊蔡金亭作者系国家社科基金青年项目"中国大学生英语产出中的母语迁移历时研究"负责人.上海财经大学教授无论学 ...

  • 对迁移学习中域适应的理解和3种技术的介绍

    作者:Harsh Maheshwari 编译:ronghuaiyang 导读 我们的目标是在一个标签可用的数据集(源)上训练神经网络,并在另一个标签不可用的数据集(目标)上保证良好的性能. 域适应是计 ...

  • 迁移学习中的域适应:3种技术

    获取有趣.好玩的前沿干货! 作者:Harsh Maheshwari 编译:ronghuaiyang AI公园 导读 我们的目标是在一个标签可用的数据集(源)上训练神经网络,并在另一个标签不可用的数据集 ...

  • 理解多任务学习中的信息迁移

    今天来看一篇多任务学习中比较基础的研究,参考文献[1]通过构建多种任务以及不同的设置,得到了一些很实用的结论. 参考文献[1]是ICLR 2020的论文. 在多任务学习中,有的时候,两种数据组合能达到 ...

  • 蔡金亭:外语学习中的母语迁移

    2020年01月08日14:47来源:中国社会科学报国家社科基金专刊作者系国家社科基金青年项目"中国大学生英语产出中的母语迁移历时研究"负责人.上海财经大学教授无论学习何种外语,我 ...

  • 华中科技大学伍冬睿教授:非侵入式脑机接口中的迁移学习综述(2016-2020)

    更多技术干货第一时间送达 大家好! 今天Rose小哥介绍关于华中科技大学伍冬睿教授关于非侵入式脑机接口中的迁移学习综述(2016-2020).本文章经伍教授授权在脑机接口社区转载. 脑机接口(Brai ...

  • 脑机接口中的流形嵌入知识迁移学习

    更多技术干货第一时间送达 关于迁移学习应用在脑机接口领域,前面我们分享过伍冬睿教授团队的<华中科技大学伍冬睿教授:非侵入式脑机接口中的迁移学习综述(2016-2020)> 迁移学习利用一个 ...

  • 伍冬睿教授:脑机接口中迁移学习的完整流程

    更多技术干货第一时间送达 大家好,今天Rose分享一篇关于脑机接口中的迁移学习的完整流程.本文由华中科技大学伍冬睿教授授权分享. 关于脑机接口中迁移学习方面的研究,伍教授团队做过大量的工作.之前社区分 ...

  • 运动想象脑机接口中迁移学习的完整流程

    更多技术干货第一时间送达 脑机接口(Brain-Computer Interface, BCI)可以让用户使用脑电信号直接与计算机或其他外部设备进行交互.该名词是由美国加州大学洛杉矶分校Vidal教授 ...