强化学习成大热门！ICML 2020 热门话题引用量最高的论文

2024-06-19 15:08:17

热门主题

根据对入选论文标题的关键词分析，入选前10的热门话题为：强化学习，神经网络，Bandit，高斯过程，图，表示，最优输运，网络，随机性，表示学习。

不同主题高引论文

利用 Aminer 按主题搜索论文及各个主题下论文按引用量排序的功能，我们可以轻松找到本次会议不同主题中那些受研究者关注的热点论文。让我们来看看不同主题的热点论文有哪些吧！

强化学习

Skew-Fit: State-Covering Self-Supervised Reinforcement Learning

引用：31

作者：Vitchyr H. Pong, Murtaza Dalal, Steven Lin, Ashvin Nair, Shikhar Bahl, Sergey Levine

机构：加州大学伯克利分校

简介:在标准强化学习中，每一项新技能都需要一个手动设计的奖励函数，这需要大量的人工努力和工程设计。自我监督的目标设定有可能使这个过程自动化，使代理能够提出自己的目标并获得实现这些目标的技能。然而，这类方法通常依赖于手动设计的目标分布，或启发式，以迫使代理探索广泛的状态。作者提出了一个正式的探索目标，以达到目标的政策，最大限度的态覆盖。作者证明了这个目标等价于目标分布的熵最大化和目标达成性能的最大化，其中目标对应于整个状态。作者提出了一种学习这种最大熵目标分布的算法，并证明了在一定的正则性条件下，本文的方法在可能的状态集合上收敛到一个均匀分布，即使事先不知道这个集合。倾斜拟合使自监督代理能够自主选择和实践不同的目标。实验表明，它可以从图像中学习各种操作任务，包括用真正的机器人开门，完全从零开始，而且不需要任何人工设计的奖励功能。

神经网络

Normalized Flat Minima: Exploring Scale Invariant Definition of Flat Minima for Neural Networks using PAC-Bayesian Analysis

引用：8

作者：Yusuke Tsuzuku，Issei Sato,Masashi Sugiyama

机构：东京大学

简介：平面最小值的概念在深度学习模型的泛化研究中起着关键作用。然而，现有的平面度定义对参数的重定标敏感。这一问题表明，先前对平坦度的定义可能不是一个很好的泛化度量，因为泛化对于这种重定标是不变的。本文从 PAC-Bayesian 的观点出发，详细讨论了关于平坦极小的讨论，并引入了规范化平坦极小的概念，它不存在已知的尺度依赖性问题。此外，作者强调了现有的基于矩阵范数的泛化误差界的尺度依赖性，类似于现有的平面极小定义。本文修改过的平坦性概念也没有受到不足的影响，这表明它可能在假设类中提供更好的层次结构。

Bandit

Reinforcement Leaning in Feature Space: Matrix Bandit, Kernels, and Regret Bound

引用：32

作者：Lin F. Yang，Mengdi Wang

机构:普林斯顿大学

简介：强化学习（RL）的探索在状态-行为空间较大时会遭受维数灾难。通常的做法是使用给定的特性参数化高维值和策略函数。然而，现有的方法要么没有理论上的保证，要么在规划期内遭受指数级的遗憾。在本文中，作者提出了一种在线 RL 算法，即 MatrixRL，它利用线性 bandit 的思想来学习概率转移模型的低维表示，同时谨慎地平衡开发-勘探的权衡。

高斯过程

Efficiently Sampling Functions from Gaussian Process Posteriors

引用：3

作者：Wilson James T，Borovitskiy Viacheslav，Terenin Alexander，Mostowsky Peter，Deisenroth Marc Peter

机构: 伦敦帝国理工学院，圣彼得堡州立大学，伦敦大学学院

简介：高斯过程是许多真实世界建模问题的黄金标准，尤其是在模型的成功取决于它忠实地表示预测不确定性的能力的情况下。这些问题通常作为更大框架的一部分而存在，其中感兴趣的数量最终通过对后验分布的积分来定义。然而，这些算法的内部工作很少允许闭合形式的积分，因此需要蒙特卡罗方法。尽管在将高斯过程扩展到大型训练集方面取得了长足的进展，但是从其后验分布精确地生成绘图的方法仍然是在测试位置的数量上按立方体进行缩放的。作者确定了高斯过程的分解，通过使我们能够有效地生成精确表示其后验的函数，自然地有助于可伸缩采样。基于这种因式分解，作者提出了一种简单易用、通用的快速后验抽样方法——解耦抽样法。解耦采样是一种下降策略，它与高斯过程的稀疏近似无缝配对，以在训练和测试时提供可伸缩性。在一系列旨在测试竞争抽样方案的统计行为和实际结果的实验中，作者从经验上证明了用解耦抽样方法绘制的函数可以真实地表示高斯过程的后验，而代价只是通常情况下的一小部分。

图

Graph Convolutional Network for Recommendation with Low-pass Collaborative Filters

引用：2

作者：Wenhui Yu，Zheng Qin

机构：清华大学

简介：带低通协同滤波器的图卷积网络（GCN）广泛应用于推荐等图形数据学习任务中。然而，当面对一个大的图时，图的卷积计算量非常大，因而在现有的所有 GCN 中都被简化，但由于过于简化而严重受损。为了解决这一差距，作者利用 GCN 中的原始图卷积，提出了一种低通协作滤波器（LCF），使其适用于大图。LCF 的设计是为了消除观测数据中由于曝光和量化而产生的噪声，并且在无损的情况下降低了图形卷积的复杂度。实验表明，LCF 提高了图卷积的效率和效率，并且本文的 GCN 明显优于现有的GCN。

表示

DeepMatch: Balancing Deep Covariate Representations for Causal Inference Using Adversarial Training

引用：8

作者：Nathan Kallus

机构:康奈尔大学

简介：当丰富的协变量和复杂的关系需要使用神经网络进行灵活的建模时，作者研究从观测数据进行因果推断的最优协变量平衡。标准方法，如倾向权重和匹配/平衡，在这种情况下失败是由于错误的倾向网络和不适当的协变量表示。作者提出了一种新的方法，基于一个加权和一个鉴别器网络的对抗性训练，有效地解决了这一方法上的差距。这一点通过该方法的新理论特征以及使用全连接结构学习复杂关系和卷积结构来处理图像混淆的实证结果来证明这一新方法如何能够在这些具有挑战性的环境中进行强有力的因果分析。

网络

Being Bayesian, Even Just a Bit, Fixes Overconfidence in ReLU Networks

引用：2

作者：Kristiadi Agustinus，Hein Matthias，Hennig Philipp

机构：图宾根大学

简介：ReLU 分类网络——可以说是应用最广泛的神经网络结构——的点估计已经被证明可以在远离训练数据的情况下产生任意高的置信度。这种结构与最大后验概率估计方案相结合，既不校准也不鲁棒。虽然贝叶斯近似的理论分析是有限的，但是经验证明近似贝叶斯推理可以改善神经网络的预测不确定性。作者从理论上分析了 ReLU 网络权值的近似高斯后验分布，并证明它们解决了过度自信问题。此外，作者还表明，即使是一个简单化的，因此便宜的贝叶斯近似，也可以解决这些问题。这表明，ReLU 网络中校准不确定度的一个充分条件是“有点贝叶斯”。这些理论结果验证了最后一层贝叶斯近似的使用，并激发了一系列保真度成本权衡。本文通过各种标准实验进一步验证了这些发现，这些实验使用普通的 deep ReLU 网络和 Laplace 近似。

随机性

The Intrinsic Robustness of Stochastic Bandits to Strategic Manipulation

引用：5

作者：Zhe Feng，David C. Parkes，Haifeng Xu

机构：哈佛大学

简介:作者研究了随机bandits算法在理性参与者（即arms）的策略行为下的行为。每一只手臂都是一个策略玩家，它可以根据跨时期的预算约束来修改自己的奖励。每只手臂都有自己的兴趣，并寻求最大化自己被拉过一个决策线期望次数。策略操纵自然而然地出现在各种经济应用中，例如 Yelp 和 Amazon 等推荐系统。作者分析了三种流行的 banditor 算法：UCB、ε-贪心算法和Thompson抽样算法的鲁棒性。证明了在策略手臂的任何（可能适应性）策略下，这三种算法都能达到令人遗憾的上界O(max{B，lnT}），其中 B 为手臂的总预算。而且，作者证明本文的遗憾上限是正确的。本文的结果说明了只要 B=O(T），bandits 算法对策略操纵的内在鲁棒性。这与更悲观的对抗策略模型形成了鲜明的对比，在这种模型中，攻击预算O（lnT）可以欺骗 UCB 和 ε- 贪心者只拉动O(T）次最优的手臂。本文的结果适用于有界和无界的回报。

表示学习

Automatic Shortcut Removal for Self-Supervised Representation Learning

引用：2

作者：Minderer Matthias，Bachem Olivier，Houlsby Neil，Tschannen Michael

机构：谷歌研究所

简介:在自监督视觉表征学习中，特征抽取器被训练在一个“pretext任务”上，该任务可以廉价地生成标签。这种方法的一个主要挑战是特征抽取器很快学会利用低级视觉特征，如色差或水印，然后无法学习有用的语义表示。许多工作已经投入到识别这些“快捷”功能和手工设计方案来减少它们的影响。在这里，作者提出了一个自动删除快捷方式功能的通用框架。关键假设是，那些首先被用来解决 pretext 任务的特征，也可能是最容易受到训练使任务变得更困难的对手的攻击。作者通过训练一个“镜头”网络来进行小的图像改变，从而最大限度地降低 pretext 任务的性能，从而证明了这一假设在常见的 pretext 任务和数据集中都是成立的。在所有测试案例中，使用修改后的图像学习的表现优于未经修改的图像。此外，镜头所做的修改揭示了 pretext 任务和数据集的选择如何影响自我监督学习的特征。

ICML 2020 已经接近尾声，想了解关于本次会议的更多信息可进入 AMiner ICML 顶会系统查看。AMiner 系统提供论文收录下载，热点统计，最佳论文解读，论文概要，论文精读，会议论文 ppt 讲解视频，华人作者、华人一作学生统计，按主题搜论文，按作者搜论文等一系列方便功能，是参会者与研究人员及对会议感兴趣的AI从业者及学生的便利工具。

ICML2021 | 四篇图网络表示能力相关论文一览（比较硬核）

点击上方蓝字关注我们在过去的几年中,以图表示的关系数据寻找最佳归纳偏差已经引起了机器学习社区的极大兴趣.依赖图结构的基于节点的消息传递机制催生了第一代图神经网络 (GNN),称为消息传递神经网络 ...
图像编辑新作：连续色彩迁移

作者来自日本福井大学和澳大利亚肯迪大学. 论文标题:Continuous Color Transfer论文链接:https://arxiv.org/abs/2008.13626 引言:图像编辑研究方向 ...
DL之GCN：GCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

DL之GCN:GCN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略相关文章 DL之GCN:GCN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 DL之GCN:GCN算 ...
ICML2021 | 可解释性：对神经网络中层特征复杂度的解释与拆分

本文转自AI科技评论随着深度神经网络的应用日益广泛,可解释性也逐渐受到更多学者的关注.目前对神经网络的可解释性研究主要分为两个方面,一方面是语义层面的解释,另一方面是数学层面对网络表达能力推导. 在 ...
ICML''20 通过图稀疏化来提升GNN的鲁棒性

fig0 论文标题:Robust Graph Representation Learning via Neural Sparsification 作者:Cheng Zheng; Bo Zong; We ...
ICML 2019 反锯齿下采样改进网络平移不变性

前几天看到一篇来自Adobe研究院的论文<Making Convolutional Networks Shift-Invariant Again>,感觉很有启发性. 论文只有一位作者,该论 ...
Softer-NMS:CMU&旷视最新论文提出定位更加精确的目标检测算法

前天arXiv新上论文<Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection>,来自卡内 ...
台球|奥沙利文誓夺世锦赛第7冠，罗伯逊誓夺第2冠，2大冠军成大热门

奥沙利文誓夺世锦赛第7冠,罗伯逊誓夺第2冠,2大冠军成大热门北京时间3月31日消息,随着2021年斯诺克巡回锦标赛圆满落幕,获得冠亚军的墨尔本机器"尼尔-罗伯逊.火箭"罗尼-奥沙 ...
境外IPO周报|上周33家公司冲刺境外IPO，科技、医疗板块成大热门？

9月2日,据资本邦统计,上周(8月24日-8月30日),美股市场仅迎来小鹏汽车(XPEV.US)一只新股,港股市场无新股上市.尽管新股市场惨淡,但有32家公司计划在境外上市,其中16家公司已向美国证监 ...
鲁能功勋转型成名帅，足协杯带队痛击恒大，未来或成鲁能新帅热门

北京时间11月26日,昆山FC与广州恒大的足协杯第2轮比赛正式打响.这场比赛昆山队主帅高尧十分重视,他不仅让本土主力悉数上场,而且还派上了两名外援出战.高尧带昆山踢以预备队球员为主的恒大,都要祭出最强 ...
他将成恒大后防新核心热门人选，表现可圈可点，未来可接班冯潇霆

广州恒大外援朴志洙日前晒出了从首尔到广州的航班登机牌,即将回到球队继续参加冬训.朴志洙是恒大上赛季后防线最佳引援,他加盟球队后就给恒大防守实力带来了明显提升.朴志洙在加盟恒大初期,他在球队的立足前景并 ...
IG世界赛夺冠成大热门，其实一战成名的还有TA

前两天,你的朋友圈被IG夺冠刷爆了吗?7年陪跑,IG赢了,LPL终于拿到了S赛的冠军, 以颠覆者的实力横空出世,一战成名. 不过,一战成名的可并不只有IG,在汽车市场中,全新长安CS55PLUS同样以 ...
每逢LOL世界赛就成大热门，盘点那些世界大赛常青树英雄！

LOL如今虽然有上百位英雄,但是能真正登上职业赛场舞台的其实就那10几个,而我们也发现 ,每次遇到S系列冠军赛的时候,有一些英雄总是会成为比赛的常客,这些英雄在平时rank中可能并不常见,但是每到世界 ...
教育部新消息，各高校医学类专业将有变化，“中医”崛起成大热门

文/跳跳妈妈谈教育高中老师经常对学生说一句谎话,"上了大学就好了",父母和老师经常对孩子说,上了大学就轻松了,你想怎么玩就怎么玩,但事实却正好相反,上了大学也不能肆意挥霍青春,否 ...
蛋白降解剂成大热门！艾伯维宣布超10亿美元合作，这次目标是癌症和免疫疾病

12月2日,制药巨头艾伯维宣布与精准医疗公司Frontier Medicines达成了一项全球性战略合作,共同开发和商业化靶向难成药蛋白靶点的创新小分子疗法.两家公司将利用Frontier专有的化学蛋 ...
【重磅】2018-19财年移民配额出炉！新财年首轮发放1000个邀请，非热门成大赢家！

新财年配额与上年没有差别,首轮1000个名额大多被非热门拿走! 刚刚,内政部发布了7.11EOI邀请官报,同时新财年的职业配额也公布了! Pro Rata职业还是之前的8类,配额没有变化. 其中会计的 ...

强化学习成大热门！ICML 2020 热门话题引用量最高的论文

相关推荐