ACL2020 最佳论文放榜！一作为微软成员

2024-05-16 08:45:12

第 58 届 ACL 会议正在如火如荼的进行，随着主会议的开始，本届会议的最佳论文也已被选出。

刚刚，自然语言处理领域的顶会 ACL 2020 公布最佳论文，本次共颁布了 4 个奖项共 8 个获奖名额，分别是：

最佳论文（1 篇）
最佳主题论文（1 篇）
最佳 DEMO 论文（1 篇）
荣誉提名论文（5 篇）

那我们来看看今年的最佳论文讲了什么，属于哪些主题，各个国家及机构的表现如何吧：

最佳论文

最佳论文的获奖者为美国的研究人员，论文题目为：
Beyond Accuracy: Behavioral Testing of NLP models with CheckList
文章来自微软研究院的 Ribeiro Marco Tulio，华盛顿大学的 Wu Tongshuang 、Guestrin Carlos，加州大学欧文分校的 Singh Sameer。

这篇文章提出了自然语言处理的一种模型无关和任务无关的测试方法，虽然测量精度一直是评价通用化的主要方法，但它往往高估了 NLP 模型的性能，而评价模型的替代方法要么侧重于个体任务，要么侧重于具体行为。受软件工程中行为测试原理的启发，作者介绍了一种测试 NLP 模型的不确定任务方法 CheckList。Checklist 包括一个通用语言能力和测试类型的矩阵，它有助于全面的测试构思，以及一个快速生成大量不同测试用例的软件工具。作者用三个任务的测试来说明 Checklist 的效用，在商业和最先进的模型中识别出了关键的失败。在一项用户研究中，一个负责商业情绪分析模型的团队在一个经过广泛测试的模型中发现了新的、可操作的错误。在另一项用户研究中，具有 Checklist 的 NLP 实践者进行了两倍多的测试，发现的 bug 几乎是没有 checklist 的用户的三倍。

论文地址：https://www.aminer.cn/pub/5eb9222f91e0118cfef98287

最佳主题论文

本届的最佳主题论文为：
Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data
文章来自华盛顿大学的 Emily M. Bender 及萨尔兰大学的 Alexander Koller

NLP 的现状是大型神经语言模型（LMs），如 BERT（Devlin et al，2019）或 GPT-2(Radford 等人，2019 年)，正在一系列任务上取得巨大进展，包括那些表面上意义重大的任务。在学术和流行出版物中，这导致了这种模型“理解”或“理解”自然语言或学习其“意义”的说法。

而在本文中，作者们认为，与当前的一些炒作相比，意义不能仅仅从形式中学习，意义是语言形式与交际意图之间的关系。这意味着，即使是像 BERT 这样的大型语言模型也不会学习“意义”；它们学习一些意义到语言形式中的反映，这在应用中非常有用。

为了与 ACL2020 主题“总结我们曾经到过的地方和我们将要去的地方”保持一致，作者认为，对形式和意义之间的区别的清晰理解将有助于引导该领域朝着围绕自然语言理解的方向发展。作者提供了一些关于如何保持一个健康的，但不夸张的，乐观的关于这些 LMs 的研究的想法。特别是，这篇论文可以被看作是在讨论当前模式的成功时精确地使用语言，以及在处理自然语言时要谦虚。

论文地址：https://www.aminer.cn/pub/5ec49a639fced0a24b4de76a

最佳 demo 论文

最 demo 论文的获奖者为来自伊利诺伊大学、哥伦比亚大学及美国陆军研究所的Manling Li
, Alireza Zareian, Ying Lin1, Xiaoman Pan, Spencer Whitehead,Brian Chen, Bo Wu, Heng Ji, Shih-Fu Chang，Clare Voss, Daniel Napierski, Marjorie Freedman 等人

论文题目为：GAIA: A Fine-grained Multimedia Knowledge Extraction System

这篇文章里，作者推出第一款全面、开放的、源多媒体知识提取系统，它将来自不同来源和语言的大量非结构化、异构的多媒体数据流作为输入，并且创建一个连贯的、结构化的知识库，索引实体、关系和事件，遵循丰富、细粒度的本体。GAIA 系统，可以无缝搜索复杂的图形查询，并检索多媒体证据，包括文本、图像和视频。GAIA 在最近的 NIST TAC SM-KBP2019 评估中获得最佳性能。该系统在 GitHub 和 DockerHub，有完整的文档。

GAIA 架构

论文地址：https://www.aminer.cn/pub/5edf299b9e795e5d07d32486

荣誉提名论文：

另外本次会议还给出了 5 篇荣誉提名论文，分别为：
1 Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks
作者：Suchin Gururangan, Ana Marasović, Swabha Swayamdipta, Kyle Lo, Iz Beltagy, Doug Downey and Noah A. Smith
论文地址：https://www.aminer.cn/pub/5ea2b8bf91e01167f5a89c9f
2 Tangled up in BLEU: Reevaluating the Evaluation of Automatic Machine Translation Evaluation Metrics
作者：Nitika Mathur, Timothy Baldwin and Trevor Cohn
论文地址：https://www.aminer.cn/pub/5ec49a639fced0a24b4de909
3 How Can We Accelerate Progress Towards Human-like Linguistic Generalization?
作者：Tal Linzen
论文地址：https://www.aminer.cn/pub/5eb7896cda5629cf24430504
4 Torch-Struct: Deep Structured Prediction Library
作者：Alexander Rush
论文地址：https://www.aminer.cn/pub/5e3940c73a55ace46ed438ba
5 Prta: A System to Support the Analysis of Propaganda Techniques in the News
作者：Giovanni Da San Martino, Shaden Shaar, Yifan Zhang, Seunghak Yu, Alberto Barrón-Cedeño and Preslav Nakov

论文地址：https://www.aminer.cn/pub/53e9b32bb7602d9703df9bde

AMiner 开发的 ACL2020 专栏现已将上述最佳论文收录且提供了解读和总结，点此进入了解。

会议概况：

今年的论文提交数量创了新纪录，ACL2019 共接收了 2906 篇论文，今年则收到了来自 57 个国家的 3429 篇论文，比 2019 年增长了 18％。此外，本次接收的论文数量也创了历史新高，共有 779 篇被接收，其中有 571 篇是长论文，而 208 篇是短论文。如果将 29 篇直接被拒和 312 篇撤回的排除在外，接收率为 25.2％。但如果加上直接被拒和撤回的，接收率只有 22.7%，跟去年持平。

机器学习、对话和交互技术、机器翻译、信息提取和 NLP 应用等领域均提交了超过 200 篇论文。

今年提交的论文涉及 25 个主题，其中包含 4 个新主题：第一，道德和 NLP 主题，包含评估了 NLP 应用程序在社会中普及时相关的伦理学假设和后果的论文；第二，对 NLP 模型的解释和分析主题；第三，理论和形式主义主题；最后一个主题是盘点我们探索过的领域和我们将要探索的领域。

会议热点词云统计

中美投稿仍占主要部分

在国家和地区层面，根据论文作者提交的国家/地区的相关统计信息，共有 57 个国家/地区提交了论文。中美依旧是 ACL 的最大输出国，贡献了超过 64% 的论文！而这两国之中，中国（包括香港、台湾、澳门）共提交论文超过 1170 篇，比美国多出了 130 多篇！稳坐投稿量第一的位置。

在被接收数方面，中国只有 205，比美国少了 100 篇。中国接收率 17.5% 遗憾未进前十，美国则未进前五。被接受论文最多的五个国家是美国（305）、中国（205）、英国（50）、德国（44）和日本（24）。如果我们考虑在提交的数量的前 15 个国家/地区，接受率最高的是以色列（40.9%）、英国（31.1%）、美国（29.4%）、德国（29.3%），香港和新加坡（两者都有26.7%）。

不同赛道的接受率统计：

自然语言处理（数学和语言学）的理论与形式，主题，资源与评估，为接受率最高的几个方向，均超过了 30%。

评审机制改革

今年评审委员会的规模创历史新高，有 9497 个审稿人注册。最终 2519 名被选为主审稿人以及 458 名被选为次审稿人，299 名被选为领域主席，40 名被选为高级领域主席。

Schütze 介绍了 ACL 的审稿制度改革，整个方案分为短期和长期，短期方案在 6 月份通过，长期方案只是一项建议。在短期方案中一个比较特殊的点是：会建立 ACL Archives，建立的动机是有很多好的论文因为没有它们没有达到 25% 的削减标准（因为它们没有达到 25% 的削减标准）。这里给出的建议是除了接收 25%，还要发表额外的 10% 在 ACL Archives。

当然，这是同行审议的另一种选择，这会导致 35% 的论文被接收，当然也没有人强制你在 ACL Archives 上发表论文，一切都是自愿的，一切都在实验中。另外，值得一提的是，ACL Archives 是独立于主会议之外的。

对话摘要简述

作者:哈工大SCIR 冯夏冲对话摘要任务在近两年得到了工业界和学术界的广泛关注.随着社会的发展和通讯技术的进步,对话数据日益增多,并且迸发出不同的形式:会议.邮件.闲聊.讨论.辩论等等.不同形式的对 ...
Science调查：怎样正确的阅读文献？

许多作者(尤其是新手作者)都想要了解更多关于如何阅读科学文献的建议.Science期刊曾专门调查了一些处于不同职业阶段和领域的科学家,告诉我们他们是如何阅读文献的(为了阅读方便,我们仅摘录部分答复). ...
周日直播：量化科学、创业、安全中的失败动力学 | Nature论文一作解读

导语人类的成就大多始于屡次的失败,但当前鲜少有研究挖掘失败动力学背后的机制.2019年Nature刊文,通过分析科研.投资.公共安全三个领域的大规模数据,阐述了失败的动力学机制.从动力学所得到的早期 ...
一个等了十年的奖：历经时间检验，字节跳动科学家获国际顶会荣誉

在瞬息万变的时代,一篇文章可以经历多长时间的检验? 最近,国际数据挖掘与知识发现大会KDD 2021公布奖项,一篇关于协同主题模型推荐算法的论文获得"时间检验研究奖".这个奖项专门 ...
59年来中国科学家团队再夺冠！字节跳动获ACL年度最高奖项

跟大家分享一个好消息. 8月5日,国际顶级学术会议ACL 2021正式颁发了大会奖项,字节跳动AI Lab的机器翻译技术论文当选今年度"最佳论文".这是ACL成立59年以来,中国科 ...
写作指南｜文献综述的“树叶模型”与两种工具

本文根据郭老师的讲座视频整理而成,文稿未经专家本人审阅.转载请在[后台]留言开. 作者简介: 郭老师,管理学博士,山东省属重点高校青椒.硕士生导师,多本CSSCI来源期刊审稿专家.近年来在<图书 ...
深度学习图像超分辨率最新综述：从模型到应用

今日arXiv新上论文<Deep Learning for Image Super-resolution:A Survey>,详细回顾了近年来基于深度学习的图像超分辨率(Super-res ...
国内唯一ACL最佳论文得主冯洋：冲击最佳论文需要知道的事情

在10月30日CCL2020的学生研讨会中,来自中科院计算所的冯洋研究员进行了<冲击最佳论文需要知道的事情>的报告. 在本次演讲中,冯洋老师分别从读者和审稿人的角度对最佳论文的共性特征进行 ...
SIGIR 2020 最佳论文放榜！清华大学成绩亮眼

从大会词云可以看出,本次会议的热点在推荐,网络,对话,强化学习,搜索等. 而就在昨日,大会公布了各项奖项,包括: 最佳论文奖 1 最佳论文荣誉提名奖 1 最佳短论文奖 1 最佳短论文荣誉提名奖 1 时 ...
【世界经济年鉴】世界经济学2019年最佳论文TOP10榜单

"最佳论文"指样本期内学术影响力最大的论文,按如下4个指标来测度:发刊影响因子,引用目标论文的其他文献的篇数,获得专家投票数,下载次数.在所有纳入选票的论文范围内,这些指标在去除量 ...
贸易和收入——利用地理时间序列（2019年世界经济学最佳英文论文TOP10榜单，第2名）

[编者按]2021年5月19日,世界银行发布图书<贸易的分配效应:实证创新.分析工具和政策应对>[1] ,有助于人们深入理解贸易在不同地区.不同行业和不同人群间的分配效应,从而形成更具包容 ...
2021年福布斯放榜，加拿大最佳雇主前15有你想（neng）去的吗？

不得不说,2020年是艰难的一年,不论是作为老板还是员工. 因为大流行,加拿大失业率从2020年初的5.6%到目前的约8.6%. 图源:CIC新闻尽管如此,许多的加拿大公司还是坚持了下来,尤其是那些 ...
AAAI 2021开幕：华人大满贯，北航学子“摘下”最佳论文，两名微软亚研院中国学者获得首个杰出SPC奖

刚刚!人工智能顶级会议 AAAI 2021 在线上开幕,作为 2021 年首个人工智能顶会,华人学者取得了大满贯. 具体表现为:两名中国来自微软亚洲研究院的中国学者获得了杰出 SPC 奖,其在众多资深 ...
KDD2021 放榜，6 篇论文带你了解阿里妈妈AI技术

关于 KDD ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是国际数据挖掘领域的顶级会议,由 ACM 的数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机协会推荐为A类会议. ...
Transformer拿下CV顶会大奖，微软亚研获ICCV 2021最佳论文

机器之心报道机器之心编辑部 ICCV 2021 全部奖项已经公布,来自微软亚洲研究院的研究者获得 ICCV 2021 马尔奖(最佳论文):最佳学生论文奖由苏黎世联邦理工学院.微软研究者获得. 10 ...
高考放榜是一面镜子

高考放榜,又是惹出来一堆的议论. 不同类型的家长,关注点也不一样. 01 关注:保送生这类家长,眼光见识均远超常人. 他们的朋友圈,在高考分数出来之前,转发了好多已经被保送的学生的分享,以及一些竞赛 ...
放榜①｜巨头营收也下滑！净利率跌至2%，千亿新贵成房企年度最大爆冷者！

2020,房企经历重重考验,上半年"集体抗疫",下半年"三道红线",如何在严监管和求发展中寻得平衡,成了每一家房企前进过程中的必答题. 历时近2个月的年报季刚刚 ...

ACL2020 最佳论文放榜！一作为微软成员

相关推荐