【图神经网络】GraphSAGE

2024-06-21 14:20:21

一、Address

发表于NIPS 2017的一篇论文

地址：https://arxiv.org/pdf/1706.02216v4.pdf

二、Introduction

首先介绍以下什么是Inductive learing

在训练过程中，已知testing data（unlabelled data）是transductive learing

在训练过程中，并不知道testing data（训练的时候只用训练样本）是inductive learing

GraphSAGE是一个通用的inductive框架，

GraphSAGE不是为每个节点训练一个不同的嵌入向量，而是训练一组聚合器函数，这些函数学习从节点的局部邻域递归地聚合特征信息（figure 1）每个聚合器函数从给定节点以外的不同跳数或搜索深度聚合信息。在测试或推理时，GraphSAGE使用经过训练的系统通过应用学习的聚合函数为未知的节点生成嵌入。

三、Model

GraphSAGE背后的关键思想是，学习如何从节点的局部邻域聚合特征信息。

首先描述GraphSAGE embedding生成（即前向传播）算法，该算法在假定GraphSAGE模型参数已经学习的情况下为节点生成embedding

3.1 Embedding生成

其中为一个图，为网络的层数，也代表着每个顶点能够聚合的邻接点的跳数，同时也是聚合器的数目，权重矩阵的数目。

3.2 Learning the parameters of GraphSAGE

本文提了有监督和无监督两种学习方式

无监督学习

基于图的损失函数期望临近节点具有相似的向量表示，同时强制要求分离的节点的表示不同：

其中是在固定长度的随机游动中在u附近出现的节点，是负采样分布，是负样本数量，是sigmoid函数。这个损失函数的表示zu是从节点的局部邻域中包含的特征生成的，而不是为每个节点训练一个唯一的嵌入（通过嵌入查找）。

有监督学习

监督学习形式根据任务的不同直接设置目标函数即可，如最常用的节点分类任务使用交叉熵损失函数。

3.3 Aggregator架构

图上的节点的邻居是无序列，因此，聚合器函数必须在无序的向量集上操作。所以理想情况下，聚合函数应该是对称的（即即改变输入的顺序，函数的输出结果不变）

Mean aggregator

文章介绍第一个聚合函数是平均算子，这里我们只取中向量的元素平均值。Mean aggregator聚合器几乎等同于在跨导GCN框架中使用的卷积传播规则。特别是，可以通过将算法1中的第4行和第5行替换为以下为GCN方法的inductive变体：

上式对应于伪代码中的第4-5行，直接产生顶点的向量表示，而不是邻居顶点的向量表示。mean aggregator将目标顶点和邻居顶点的第k-1层向量拼接起来，然后对向量的每个维度进行求均值的操作，将得到的结果做一次非线性变换产生目标顶点的第k层表示向量。

LSTM aggregator

LSTMs具有更大的表达能力。然而，需要注意的是，lstm不是固有对称的（即，它们不是置换不变的），因为它们以顺序方式处理它们的输入。我们通过简单地将LSTMs应用于节点邻居的随机排列，使LSTMs适应于在无序集上操作

“

LSTM相比简单的求平均操作具有更强的表达能力，然而由于LSTM函数不是关于输入对称的，所以在使用时需要对顶点的邻居进行一次乱序操作。

”

排列不变性（permutation invariance）：指输入的顺序改变不会影响输出的值。

Pooling aggregator

Pooling aggregator是对称的和可训练的。在这种池方法中，每个邻居的向量通过完全连接的神经网络独立地馈送（进行一次非线性变换）；在这种转换之后，进行过pooling操作来聚合邻居集中的信息，然后将结果与目标节点的embedding进行拼接，再进行一次非线性变换，最后得到第k层表示向量

四、Experiments

五、Conclusion

1.GraphSAGE是一个通用的inductive学习框架，核心是学习为每一个node生成表示向量的映射，而不用在数据更新之后重新训练一次。

2.GraphSAGE的采样机制有效提高了gcn的扩展性和有效解决了训练难度的问题。

阿里电商场景下的大规模异构网络表示学习

根据图结构(同构/异构)以及是否包含节点特征,我们将图分为如下六类:HON, AHON, HEN, AHEN, MHEN, AMHEN.同时我们也在下表中列出了处理各种类型的图的方法(其中GATNE- ...
【ICLR 2019论文】互信息最大化的无监督图神经网络Deep Graph Infomax

把神经网络模型扩展到图结构数据是当前机器学习领域的研究热点,其中的代表有图卷积网络以及它的变种形式.图卷积网络的训练通常采用监督学习的方法,借助图或节点的标签定义优化目标. 然而很多情况下,尤其是面对 ...
万字干货 | 图表示学习中的Encoder-Decoder框架

第一时间获取价值内容图表示学习Encoder-Decoder框架介绍和拓展本篇文章主要从一篇关于Graphs的表示学习的调研文章出发,介绍基于Graph表示学习的一个Encoder-Decoder ...
GraphSAGE FM Transformer强强联手：评微信的GraphTR模型

如上所述,微信团队需要在包含多域信息的异构图上完成图卷积,每个节点要聚合来自多个领域的异构消息.之前传统的聚合方式,如mean/max pooling,矩阵相乘,可能带来异构消息相互抵销而引入信息损 ...
基于 GraphSAGE 的结构特征学习，了解一下

本文提出的算法主要聚焦于单一时刻子网络的结构特征学习,在这里我们借鉴了 GraphSAGE 通过对当前节点以及其邻居节点的特征信息的聚合来得到节点嵌入的思路. 和GraphSAGE不同的是,Graph ...
启发式

启发式函数h(n)告诉 A*从任何顶点到目标的最小成本的估计n.选择一个好的启发式函数很重要. A* 对启发式算法的使用# 启发式可用于控制 A* 的行为. 一个极端,如果h(n)是0,那么只g(n) ...
人工智能中图神经网络GNN是什么？

人工智能算法与Python大数据致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容公众号点上方人工智能算法与Python大数据获取更多干货在右上 ...
图神经网络的解释性综述！

AI蜗牛车 151篇原创内容公众号 Datawhale干货来源:纪厚业,北京邮电大学,图与推荐编辑:数据派THU 本文约1.5w字,干货满满,建议收藏本文对近期提出的 GNN 解释技术进行 ...
图神经网络概述第三弹：来自IEEE Fellow的GNN综述 | 机器之心

图神经网络(GNN)热度持续上升,之前我们曾介绍了清华两篇综述论文,参见:深度学习时代的图模型,清华发文综述图网络,和清华大学图神经网络综述:模型与应用.最近,IEEE Fellow.Senior M ...
【图神经网络】GCN-2（ChebyNet）

一.Address 发表于NIPS 2016的一篇论文: Convolutional Neural Networks on Graphs with Fast Localized Spectral Fi ...
【图神经网络】GCN-1（谱图卷积）

一.Address Spectral Networks and Deep Locally Connected Networks on Graphs 地址:https://arxiv.org/pdf/1 ...
AAAI2021论文: 时空Kriging的归纳式图神经网络

AAAI2021论文: 时空Kriging的归纳式图神经网络
详解NLP中的预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文...

NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生. 我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准 ...
[万字长文] 图神经网络的解释性综述

图神经网络的可解释性是目前比较值得探索的方向,今天解读的2021最新综述,其针对近期提出的 GNN 解释技术进行了系统的总结和分析,归纳对比了该问题的解决思路.作者还为GNN解释性问题提供了标准的图数 ...
【赠书】图神经网络基础与前沿最新书籍，赠5本学习

假期快要到了,本次给大家赠送5本人工智能领域的技术书籍,这次赠送的书籍是<图神经网络基础与前沿>. 这是一本什么样的书图神经网络是近两年学术界的热点,在顶级会议上的文章越来越多.目前图像 ...