陈丹琦团队最新论文：受 GPT-3 启发，用小样本学习给语言模型做微调，性能最高提升30%

2024-08-02 12:36:26

2020年，GPT-3可谓火出了圈。

不仅讲故事的本职工作做得风生水起，还跨界玩起了网页设计、运维、下象棋……

不过，尽管表现惊艳，GPT-3背后到底是实实在在的1750亿参数，想要在实际应用场景中落地，难度着实不小。

现在，针对这个问题，普林斯顿的陈丹琦、高天宇师徒和MIT博士生Adam Fisch在最新论文中提出，使用较小的语言模型，并用少量样本来微调语言模型的权重。

并且，实验证明，这一名为LM-BFF（better few-shot fine-tuning fo language models）的方法相比于普通微调方法，性能最多可以提升30%。

详情如何，一起往下看。

方法原理

首先，研究人员采用了基于提示的预测路线。

所谓基于提示的预测，是将下游任务视为一个有遮盖（mask）的语言建模问题，模型会直接为给定的提示生成文本响应。

这里要解决的问题，是寻找正确的提示。这既需要该领域的专业知识，也需要对语言模型内部工作原理的理解。

在本文中，研究人员提出引入一个新的解码目标来解决这个问题，即使用谷歌提出的T5模型，在指定的小样本训练数据中自动生成提示。

其次，研究人员在每个输入中，以额外上下文的形式添加了示例。

问题的关键在于，要有限考虑信息量大的示例，一方面，因为可用示例的数量会受到模型最大输入长度的限制；另一方面，不同类型的大量随机示例混杂在一起，会产生很长的上下文，不利于模型学习。

为此，研究人员开发了一种动态的、有选择性的精细策略：对于每个输入，从每一类中随机抽取一个样本，以创建多样化的最小演示集。

另外，研究人员还设计了一种新的抽样策略，将输入与相似的样本配对，以此为模型提供更多有价值的比较。

实验结果

那么，这样的小样本学习方法能实现怎样的效果？

研究人员在8个单句、7个句子对NLP任务上，对其进行了系统性评估，这些任务涵盖分类和回归。

结果显示：

基于提示的微调在很大程度上优于标准微调；
自动提示搜索能匹敌、甚至优于手动提示；
加入示例对于微调而言很有效，并提高了少样本学习的性能。

在K=16（即每一类样本数为16）的情况下，从上表结果可以看到，该方法在所有任务中，平均能实现11%的性能增益，显著优于标准微调程序。在SNLI任务中，提升达到30%。

不过，该方法目前仍存在明显的局限性，性能仍大大落后于采用大量样本训练获得的微调结果。

关于作者

论文有两位共同一作。

高天宇，清华大学本科生特等奖学金获得者，本科期间即发表4篇顶会论文，师从THUNLP实验室的刘知远副教授。

今年夏天，他本科毕业后赴普林斯顿攻读博士，师从本文的另一位作者陈丹琦。

此前，量子位曾经分享过他在写论文、做实验、与导师相处方面的经验。

Adam Fisch，MIT电气工程与计算机科学专业在读博士，是CSAIL和NLP研究小组的成员，主要研究方向是应用于NLP的迁移学习和多任务学习。

他本科毕业于普林斯顿大学，2015-2017年期间曾任Facebook AI研究院研究工程师。

至于陈丹琦大神，想必大家已经很熟悉了。她本科毕业于清华姚班，后于斯坦福大学拿下博士学位，2019年秋成为普林斯顿计算机科学系助理教授。

最后，该论文代码即将开源，如果还想了解更多论文细节，请戳文末论文链接详读~

传送门

论文地址：
https://arxiv.org/abs/2012.15723v1

项目地址：
https://github.com/princeton-nlp/LM-BFF

AAAI 2021：基于对比自监督学习的图分类

本文转自 MIND Laboratory微信公众号,原文地址 https://mp.weixin.qq.com/s/nB-hUPeiRcDiSd6uja6rUQ Contrastive Self-su ...
60亿击败1750亿、验证胜过微调：OpenAI发现GPT-3解决数学题，并非参数越大越好

机器之心报道编辑:杜伟.陈现在,OpenAI 的模型也具备解决小学数学应用题的能力了. 简单的小学数学应用问题,对于人类来说不算什么,但对于模型来说,可能是有难度的. 比如问题:安东尼有 50 支 ...
一文看尽 27 篇 CVPR2021 2D 目标检测论文

作者丨二玖编辑丨极市平台极市导读本文对我们汇总的 CVPR 2021 检测大类中的2D目标检测领域的论文进行了盘点,将会依次阐述每篇论文的方法思路和亮点.在极市平台回复"CVPR21检 ...
陈丹琦博士论文翻译：神经阅读理解与超越（Neural Reading Comprehension a

上午看到FlyAI-AINLP群里李俊毅同学发出的一条信息: 最近刚翻译.整理完的陈丹琦博士的论文,https://chendq-thesis-zh.readthedocs.io/en/latest/ ...
Hinton新作！越大的自监督模型，半监督学习需要的标签越少

本文介绍了Hinton团队发表在NeurIPS 2020上的一项研究工作,一作是Ting Chen,研究人员首次在ImageNet上尝试了半监督学习的典型范式,并取得了优越的结果.此外,他们还发现,网 ...
写作神器还是魔鬼化身？万能语言模型GPT-3起底

「工程壮举」「人间奇迹」GPT-3,会让人类离没事做又近一步吗? 编译 | 心缘编辑 | 漠影 2020年6月,在训练约2000亿个单词.烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红. ...
ICLR 2019论文主题|RL最受欢迎，RNN下降幅度最大，GAN仍在继续发展

本文作者:Chip Huyen 编译:学术君相比于闹得沸沸扬扬的IJCAI审稿争议,2019 ICLR的评审结果没有出现太多争论.并于 2019年5月6日至9日在美国新奥尔良举行会议.2019年的投 ...
普林斯顿陈丹琦团队最新论文：受GPT-3启发，用小样本学习给语言模型做微调，性能最高提升30% | ...

IDC发布2021年中国人工智能市场10大预测近日,国际数据公司(IDC)发布了<IDCFutureScape:全球人工智能(AI)市场2021预测--中国启示>报告.在报告中,IDC全 ...
陈丹琦：我希望女生能得到更多机会，男女生之间的gap会逐渐不存在的

https://m.toutiao.com/is/eRDFyeu/ 人物简介:陈丹琦 Danqi Chen 湖南长沙人.高中毕业于雅礼中学.第 20 届国际信息学奥林匹克竞赛(IOI2008)金牌得主 ...
专家点评 | 华中科大骆清铭团队最新论文：线照明调制显微术实现高清成像

小柯小柯生命今天北京时间2021年3月2日凌晨,<自然-方法>(Nature Methods)以长文形式刊发了华中科技大学武汉光电国家研究中心生物医学光子学功能实验室骆清铭院士团队的 ...
陈丹琦新作：关系抽取新SOTA，用pipeline方式挫败joint模型

本文转载自:机器之心 | 编辑:魔王.小舟端到端关系抽取涉及两个子任务:命名实体识别和关系抽取.近期研究多采用 joint 方式建模两个子任务,而陈丹琦等人新研究提出一种简单高效的 pipel ...
都是心灵鸡汤，于丹被轰下台，陈果在复旦大学却很受欢迎，为何？

"师者,传道授业解惑",说的是老师最主要的责任就是要给学生传授知识,解答疑惑.因此,对于学生来说,老师的影响是非常大的.一个好的老师,不仅能够将更多的知识传授给学生,同时也会通过教 ...
【病房故事】小切口为83岁老人换“心门” ——我院心外科陈兴澎团队成功为83岁高龄老人施行微创小切口...

"本想着肯定逃不过动一次'大刀',没想到只切了这么小的口子,就把心脏病都治好了!"看到愈合得很好的小伤口,患者乔老爷子高兴得不得了.在仅有10cm的小切口下,医生们成功完成了心脏& ...
台州牵手陈十一院士团队丨共同打造国际高端工业软件中心

台州牵手陈十一院士团队丨共同打造国际高端工业软件中心和国际科学家创业基地2021/5/7 21:32:02 来源:台州新闻APP 作者:台州新闻客户端记者陶宇新/文孙金标/摄 5月7日下午 ...
丹琦女神新作：对比学习，简单到只需要Dropout两下

小伙伴们表示,插入替换的数据增强方式已经Out了,SimCSE才是现在的靓仔. snowfloating说:看完Danqi Chen组里的SimCSE,再看这篇感觉就没什么惊喜了. 苏神: 直接用dr ...

陈丹琦团队最新论文：受 GPT-3 启发，用小样本学习给语言模型做微调，性能最高提升30%

方法原理

实验结果

关于作者

传送门

相关推荐