ICLR 2020 | 预训练图神经网络模型

2024-05-13 12:20:16

原文：Strategies for Pre-training Graph neural networks

预训练是通过大量无标注的数据进行模型的训练，得到一套模型参数，利用这套参数对模型进行初始化，再根据具体任务在现有语言模型的基础上进行精调（MSRA）。预训练的方法在自然语言处理与计算机视觉领域，都被证明拥有更好的效果。不过，在图的表示学习领域，预训练仍然是一个具有挑战性的问题。本文提出了一个在多图分类任务上的图神经网络预训练模型，希望得到节点级别和图级别的高质量预训练参数，可以鲁棒的迁移到下游任务。

模型的预训练主要分为节点级预训练和图级别预训练两步。

在节点级上，预训练时分别考虑图的结构特征以及属性特征。在结构特征方面，文中将常见的“节点-邻居”模型扩展为“节点邻居子图+上下文子图”，用节点邻居子图与上下文子图的相似性衡量结构相似性，分别用图神经网络学习两个子图的特征。节点邻居子图和上下文子图之间的锚节点（“context anchor nodes”）体现了节点邻居子图和上下文子图之间的信息关联。在属性特征方面，利用”MASK-PREDICT”的方法，通过分别mask节点和边的属性来学习图的属性特征，这种方法可以是的帮助模型对 domain knowledge 的学习。

在图级别上，文中提出了 2 种与训练过方法。一种为在图级进行有监督的多任务学习（multi-task learning）。在该场景下一般要求预训练时的任务与实际的下游任务存在较好的关联性，才能取得较好的预训练效果。另一种方法为计算不同图的相似性（比如图的编辑距离或者图的结构相似性等）来进行训练，这种方法的难点在于如何合理地衡量两个图之间的相似性。文中采取的预训练方式为，先进行节点级的预训练，然后利用有监督的多任务学习进行图级别的预训练。作者认为，直接进行多任务图级别的预训练可能会造成 negative transfer。

实验结果：

作者在论文公布的数据集上用常见的图神经网络模型进行了实验。可以看出，pre-training 使得 GIN、GCN 和 GraphSAGE 的模型表现均取得了提升，GAT 的表现显著下降。作者认为，GIN 的表达力更强，在多数据和领域的 pre-training 上能够取得更好的提升。本文首次提出了大规模图神经网络预训练模型，对未来的相关研究具有参考意义。

近期精彩集锦（点击蓝色字体跳转阅读）：

从4大顶会看GNN预训练技术进展

论文推荐 /introduction/ 机器学习的成功很大程度上取决于数据.但是,高质量的标记数据通常很昂贵且难以获得,尤其是对于训练参数较多的模型.而我们却可以很容易地获取大量的无标记数据,其数量可 ...
Current Biology：视觉想象和视觉感知共享Alpha频带中的神经表征

为了具有足够的灵活性进行适应性行为,生物体必须认识到对物理刺激的即时反应.为此,人类使用视觉心理想象从记忆中唤起生动的内部体验的能力,代表了对刺激的感知.视觉想象的内容主观上模仿了感知的内容,这表明想 ...
Nature Neuroscience：边中心功能网络模型下大脑系统水平的重叠组织构架

<本文同步发布于"脑之说"微信公众号~> 导读: 传统的网络神经科学均以节点为中心,将一些神经元素定义为节点,将节点间的交互关系作为网络的边来搭建网络模型,但这种方法只 ...
从毛坯开始搭建sota 图神经网络

转载于 :新智元图神经网络近几年的发展十分火热,主要原因还是图能够表示连通关系,例如知识图谱等更贴切现实应用!Google Research最近发了一篇博客,从零开始教学GNN的发展路程,不熟悉的同 ...
万字综述，GNN在NLP中的应用，建议收藏慢慢看

来自:图与推荐今天为大家解读的是由京东硅谷研发中心首席科学家吴凌飞博士等研究者最新发表的GNN for NLP综述,几乎覆盖了围绕NLP任务的所有GNN相关技术,是迄今为止GNN for NLP领域 ...
ICLR 2020 谷歌使用预训练技术来改进向量召回

Take away 因为我之前也经常在知乎看别人的论文阅读笔记,其实不喜欢那种整篇顺一遍几乎没有翻译或提炼的笔记.但会议通货膨胀,很容易遇到水文,我想每篇阅读笔记最前面都写一些take away,大家 ...
ICLR 2020 | 用ELECTRA实现更高效的NLP模型预训练

背景题目:ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators 机构:斯坦福.Google Bra ...
预训练语言模型关系图必读论文列表，清华荣誉出品

项目作者:王晓智.张正预训练语言模型(PLM)是 NLP 领域的一大热门话题.从 BERT 到 GPT2 再到 XLNet,各种预训练模型层出不穷,不少同学感叹,「大佬慢点,跟不上了--」那么,这么 ...
完整的动手指南，可在Google Colab GPU上训练你的神经网络模型

介绍如果你是神经网络领域的初学者,那么你可能已经使用过CPU训练模型.好吧,即使你的模型有 100000 个参数也没关系,训练模型可能需要几个小时.但是,如果你的模型有 100 亿或 200 亿个参 ...
ICLR 2020 | NLP 预训练模型的全新范式：对比学习

生成式模型有着其天生的优势,即学习到丰富的特征,但它也有广受诟病的确定.判别式目标函数--长期以来被认为是无用的.这是因为,判别式模型通常不是直接拟合原有的分布流形,学习到的特征较为单一.但是,最近一 ...
ICLR 2020 | 探索新的图表征学习思路

图表示学习一直是机器学习中一个重要的问题.除却耳熟能详者有 DeepWalk 类者.GNNs类者.生成类如 GraphGAN 者等等,还有哪些模型是值得去探索的呢?下面的两篇文章分别在节点层面和图层面 ...
ICLR 2020 | 基于谱方法的高效多级图嵌入框架

图嵌入越来越多地被应用在非欧数据的表示学习上.图嵌入旨在将图中的节点映射到低位向量编码空间中并尽可能地保留节点的特征. "如何同时有效地利用图的结构性和节点属性特征来提升表达力"以 ...
Keras之CNN：基于Keras利用cv2建立训练存储卷积神经网络模型(2+1)并调用摄像头进行实时人脸识别

Keras之CNN:基于Keras利用cv2建立训练存储卷积神经网络模型(2+1)并调用摄像头进行实时人脸识别输出结果设计思路核心代码 # -*- coding:utf-8 -*- import ...
COLING 2020 | CharBERT：字符敏感的预训练语言模型

©PaperWeekly 原创 · 作者|张琨学校|中国科学技术大学博士生研究方向|自然语言处理论文标题: CharBERT: Character-aware Pre-trained Langu ...

ICLR 2020 | 预训练图神经网络模型

相关推荐