6 月 3 日,国际机器学习顶会 ICML 2020 放出了论文接收结果。据官方统计,ICML 2020 共提交 4990 篇论文,投稿数量再创新高,而最终接收论文 1088 篇,接收率 21.8%。与往年相比,接收率逐年走低。
ICML 是机器学习领域最重要的会议之一,因此在该会议上发表论文的研究者也会备受关注。受到疫情影响,今年的 ICML 大会已经改为在 2020 年 7 月 13 日至 18 日线上举行。
在ICML2020召开之前,我们根据论文作者,研究机构,国家和地区几方面给出了对本届ICML会议的基本统计数据,以便大家对此次会议有一个基本了解。
论文作者
让我们首先来看一论文作者的排名(按论文数量)
在 ICML 上发表论文是很困难的,因此能够一次性发表多篇论文的作者会让人印象深刻。来自日本理化学研究所(RIKEN)和东京大学的 Masashi Sugiyama 有 11 篇论文被接收,成为大会中被接收论文数量最多的作者。
在他之后是 Michal Valko(DeepMind)、Michael Jordan(UC Berkeley)以及 Dale Schuurmans(Google / U. of Alberta),三人均有 8 篇文章被接收。他们也是大多数论文的最后作者(这对大多数作者来说都是如此,许多人都是资深的资深研究者)。虽然没有被列在这张图的顶部,但是普林斯顿大学的 Chi Jin 作为第一作者的论文最多(3 篇第一作者论文超过 6 篇被接受的论文),而 Alexey Drutsa 是来自 YANDEX 的最多的单篇论文(2 篇论文是单独作者超过 3 篇被接受的论文)。
排名前50的论文作者
从每篇论文的作者数量的分布来看,大多数论文有 3-4 个作者,但是也有一些例外情况,比如 15 个作者。有 15 个作者的两篇论文分别是:由来自谷歌、牛津大学、剑桥大学、哥伦比亚大学和伯克利大学 15 位研究者发表的论文《Stochastic Flows and Geometric Optimization on the Orthogonal Group》和来自天津大学、阿里巴巴、清华大学以及上海交大的 15 位研究者发表的论文《Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential Advertising》。
每篇论文作者数统计
这一部分展示的是论文作者与其所在国家或地区之间的关联,以便查看哪个国家或地区发表论文数量最多。这种关联数据的统计可能会有偏差,主要是因为无法辨认的人名缩写、不同人对同一机构的不同叫法、错别字等问题。
不同国家的论文数统计
毫不意外,美国承包了绝大多数论文。美国研究者参与的论文有 728 篇,大约是论文总数的 3/4,与其他国家和地区相比具有巨大的优势。排在第二位的是英国(123 篇),第三位是中国大陆(122 篇),二者在接收论文数量上相差无几,但同样仅为美国的六分之一左右。
需要注意的是,国家或地区是根据组织机构的总部所在地而定,而非论文作者所在位置。因此,如果一位论文作者在 Google 苏黎世工作,那么该论文被计入美国,而不是瑞士。
尽管如此,统计数量和实际情况也相差不多。如果仅按照大学分类(全球只有一个从属国家和地区的组织),那么将得到下图:
不同国家论文数(仅统计大学)
也就是说,即使不考虑企业机构的因素,美国研究者仍然参与了 ICML 发表论文的一半以上。如果加上所有在美国工作的工业界研究者,数量可能和之前的图很接近。值得一提的是,英国和中国大陆大约发表了相同数量的文章。共有 494 个机构,362 所(73.3%)来自工业机构和 132(26.7%)来自学术界。587 篇论文(53.9%)纯粹隶属于学术研究,而只有 90 篇论文(8.3%)纯粹来自工业研究组织,411 篇论文(37.8%)隶属于两者。前 50 的机构发表了几乎全部的论文,谷歌公司排名总体第一也是工业界排名的第一,谷歌的附属机构 Deepmind 与 Google brain 也位于工业界排名的前 4 名,微软公司在工业界排名第三。排名最高的大学分别为 MIT,Stanford,UC Berkeley,总体排名也仅次于 Google。在学术机构排名中 CMU 紧追上述 3 所大学排名第四。
总体排名及工业学术排名
让我们再分别来看下论文数量排名靠前的几个国家和地区机构的情况:
美国有大量的组织,无论是在工业还是在学术界,都有大量的论文。相反,英国的表现是由 DeepMind 领导的,其次是大学。
中国拥有强大的机构,但华为、阿里巴巴和百度等公司正在迎头赶上。在加拿大,几乎所有的论文都是大学发表的。另外除了美国和中国大陆,大多数国家和地区发表论文的顶级机构都是大学。从全球范围看,大学发表的论文数量是公司的 3 倍。在美国以外,只有来自英国(DeepMind)、法国(Criteo)、中国大陆(华为、百度、阿里巴巴)、俄罗斯(Yandex)以及韩国(Samsung)的某些机构发表了 5 篇以上的论文。因此我们可以下结论说 ICML 仍然是以学术界为主导的会议。
每篇论文参与的组织数
大多数论文有 1 或 2 个组织,但有些论文的撰写有 7 个组织的参与。两篇有 7 个组织参与的论文分别是:由谷歌、微软、华沙大学、阿姆斯特丹大学、加州大学欧文分校、苏黎世联邦理工学院以及伦敦帝国理工学院的研究者协作完成的《How Good is the Bayes Posterior in Deep Neural Networks Really?》和由蒙特利尔大学、IIIT Hyderabad、麻省理工学院、Mila、特拉华大学以及 LinkedIn 等机构的研究者协作完成的《Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning》。在 ICML 2020 即将来临之际,为了让大家能方便且第一时间了解 ICML 顶会的相关信息与论文的解读,AMiner 提供了 ICML 2020 顶会专版,欢迎大家了解!https://www.aminer.cn/conf/icml2020/?s=al