支持异构图、集成GraphGym！超好用的图神经网络库PyG更新2.0版本

2024-08-03 16:41:26

本文转载自：机器之心 | 编辑：陈萍、杜伟

当前最流行和广泛使用的 GNN 库 PyG（PyTorch Geometric）现在出 2.0 版本了，新版本提供了全面的异构图支持、GraphGam 以及很多其他特性，这一系列改进，为使用者带来了更好的用户体验。

PyTorch Geometric（PyG）是一个构建于 PyTorch 之上的库，用来为一系列与结构化数据相关的应用编写和训练图神经网络（GNN）。PyG 对机器学习研究者以及机器学习工具包的首次使用者都很友好。

就其特征和功能而言，PyG 具有易用和统一的 API，用户花费更少的时间在实现和运行图神经网络的底层机制上，只需要 10 至 20 行代码就可以训练自定义 GNN 模型。PyG 涵盖了大量的 SOTA GNN 架构以及训练和可扩展流程，并且易于扩展以匹配用户自己的特定用例或进行自己的 GNN 研究。

此外，PyG 中的全新 GraphGym 使得用户可以轻松地复现 GNN 实验，执行和分析数千个 GNN 实验，并将自定义模块嵌入到 GNN 学习 pipeline 中。

近日，PyG 核心领导者（Core lead）Matthias Fey 宣布 PyG 2.0 版本来了！新版本提供了全面的异构图支持、GraphGam 以及很多其他特性。

PyG 2.0 详情地址：https://github.com/pyg-team/pytorch_geometric/releases/tag/2.0.0

PyG 2.0 新特性

PyG 2.0 是一个新的版本，提供了复杂的异构图支持、GraphGym 集成以及其他新特性。

PyG 2.0 中提供了完全的异构图支持。异构图支持包括数据存储层的完整重写（同时保持向后兼容性）、异构图转换、通过邻采样的关系型数据加载例程，以及一整套异构 GNN 模型 / 示例。

突出亮点

异构图存储：异构图现在可以存储在它们自己的专用 data.HeteroData 类中。

from torch_geometric.data import HeteroDatadata = HeteroData()# Create two node types 'paper' and 'author' holding a single feature matrix:

data['paper'].x = torch.randn(num_papers, num_paper_features)data['author'].x = torch.randn(num_authors, num_authors_features)# Create an edge type ('paper', 'written_by', 'author') holding its graph connectivity:data['paper', 'written_by', 'author'].edge_index = ... # [2, num_edges]

异构 Mini-Batch 加载：异构图可以分别通过 loader.DataLoader 和 loader.NextorLoader 对许多小的、单个的巨大图进行转化，转换成 mini-batches。这些 loaders 现在可以处理同构图和异构图：

from torch_geometric.loader import DataLoaderloader = DataLoader(heterogeneous_graph_dataset, batch_size=32, shuffle=True)from torch_geometric.loader import NeighborLoaderloader = NeighborLoader(heterogeneous_graph, num_neighbors=[30, 30], batch_size=128,                        input_nodes=('paper', data['paper'].train_mask), shuffle=True)

异构图神经网络：异构 GNN 现在可以通过 nn.to_hetero、nn.to_hetero_with_bases 从同构 GNN 轻松创建。这些进程采用现有的 GNN 模型并复制其消息功能，以考虑不同的节点和边缘类型：

from torch_geometric.nn import SAGEConv, to_hetero

class GNN(torch.nn.Module): def __init__(hidden_channels, out_channels): super().__init__() self.conv1 = SAGEConv((-1, -1), hidden_channels) self.conv2 = SAGEConv((-1, -1), out_channels)

def forward(self, x, edge_index): x = self.conv1(x, edge_index).relu() x = self.conv2(x, edge_index) return x

model = GNN(hidden_channels=64, out_channels=dataset.num_classes)model = to_hetero(model, data.metadata(), aggr='sum')

使用 GraphGym 管理实验

PyG 2.0 现在通过 torch_geometric.graphgym 正式支持 GraphGym。总的来说，GraphGym 是一个平台，用于通过高度模块化的 pipeline 从配置文件中设计和评估图神经网络：

GraphGym 是开始学习标准化 GNN 实现和评估的最佳平台；
GraphGym 提供了一个简单的接口来并行尝试数千个 GNN 架构，以找到适合特定任务的最佳设计；
GraphGym 可轻松进行超参数搜索并可视化哪些设计选择更好。

重大改变

datasets.AMiner 数据集现在返回 data.HeteroData 对象；transforms.AddTrainValTestMask 已被替换为 transforms.RandomNodeSplit；由于 data.Data 的存储布局发生了显着变化以支持异构图，因此需要通过删除 root/processed 文件夹来重新处理已处理的数据集。

此外，data.Data.__cat_dim__ 、 data.Data.__inc__现在需要额外的参数输入：

def __cat_dim__(self, key, value, *args, **kwargs):    passdef __inc__(self, key, value, *args, **kwargs):    pass

如果你修改了自定义 data.Data 对象中的__cat_dim__或__inc__ ，请确保应用上述更改。

了解更多变化，请参考原项目。

核心团队成员

PyG 核心团队共有 6 位成员，包括多特蒙德工业大学四年级图机器学习博士生 Matthias Fey、多特蒙德工业大学博士生 Jan Eric Lenssen（核心贡献者）和图网络领域大牛 & 斯坦福计算机科学副教授 Jure Leskovec（担任顾问）。

从左至右依次为 Matthias Fey、Jan Eric Lenssen 和 Jure Leskovec。

此外还有三位华人成员，分别是斯坦福大学计算机科学四年级博士生尤佳轩（Jiaxuan You，核心领导者）、斯坦福大学计算机科学博士生 Rex Ying（核心贡献者，他将于 2022 年加入耶鲁大学担任助理教授）和卡内基梅隆大学 - 汉斯学院三年级博士生赵越（Yue Zhao，核心贡献者）。

从左至右依次为尤佳轩、Rex Ying 和赵越。

日前，赵越在知乎分享了自己参与 PyG 2.0 版本设计与升级过程中的心得体会，感兴趣的读者可以参考阅读。

知乎链接：https://www.zhihu.com/pin/1420674585365196800

参考链接：

http://www.pyg.org/

TensorFlow 学习资料下载

业界盘点|为什么推荐算法都开始结合图神经网络了？

大家好,我是对白. 图神经网络(GNN)相信大家也不陌生了,在还没有Graph Embedding之前,节点的属性信息可以通过Item2vec这种序列化Embedding的方式去学习,效果虽然不错,但 ...
牛刀小试之用pytorch实现LSTM

LSTM参数首先需要定义好循环网络,需要nn.LSTM(),首先介绍一下这个函数里面的参数 LSTM数据格式: num_layers: 我们构建的循环网络有层lstm num_directions: ...
2019年上半年收集到的人工智能图神经网络干货文章

2019年上半年收集到的人工智能图神经网络干货文章「AI初识境」从头理解神经网络-内行与外行的分水岭人工智能中"图神经网络GNN"如何理解?(附斯坦福综述) 清华大学图神经网络 ...
清华唐杰教授综述全面解读网络表示学习（NRL）最新动态

撰文:吴婷婷在计算机技术飞速发展的今天,机器处理现实生活中复杂任务的能力也越来越强大.其中,从现实世界网络中挖掘有效.相关的信息在许多新兴应用中起着至关重要的作用.例如,在社交网络中,根据个人资料和 ...
推荐与图：从GNN的视角出发，重新审视推荐系统

深度学习模型是当今人工智能研究的核心.众所周知,对欧几里得数据(例如图像)和序列数据(例如文本)具有颠覆性学习能力的深度学习技术不能直接适用于图结构数据.这种差距推动了图深度学习研究的浪潮.近年来,已 ...
实例分割新思路之SOLO v1&v2深度解析

前言实例分割一般有两种做法,一种是top-down,既先检测 bbox,后在每个bbox中进行mask的分割,例如Mask R-CNN.第二种为bottom-up做法,先分割出每一个像素,再进行归类 ...
大版本号跨越，AIDA64更新6.0版本：更新测试，支持Zen 2架构

玩家在购买.测试电脑时会使用如CPU-Z等工具,但是这些工具都不能完整查看电脑所有的硬件信息.所以有时我们会使用AIDA64这样的工具.之前AIDA64的版本号停留在了5.99版,所以在近日的更新中, ...
5本良品小说，主角在异世界利用各种超能力爬科技树，爽点十足！

5本良品小说,主角在异世界利用各种超能力爬科技树,爽点十足! 第一本:<龙背上的训练家> 作者:开泽书评:宝可梦同人文,作者致力于创造一只银翼飞龙,主角自然也是要成为御龙大师的人.龙蛋群 ...
传统图像处理与深度学习又一结合：时空多尺度非局部自相似集成视频超分

作者丨Happy 编辑丨极市平台极市导读本文将传统图像处理中的自相似性.金字塔等思路与深度学习相结合进行视频超分,得到了SOTA指标,并为传统图像处理思路与深度学习提供了一个新的结合点.>& ...
敢闯敢试勇担当 2020年海南省重大科技计划项目启动实施：立项支持19个项目总投资超2亿元

经省政府同意,省科学技术厅启动实施2020年海南省重大科技计划项目,立项支持海南省重大科技计划项目19个,总投资2.5699亿元,省财政计划资助经费2.016亿元. 2020年海南省重大科技计划项目重 ...
外媒上手高通3D Sonic Max指纹识别：支持活体检测，速度超快

在昨天的议程上,高通除了公布骁龙865.骁龙765以及骁龙765G三款处理器产品之外,还发布了第二代的超声波指纹识别传感器3D Sonic Max.对于新的传感器,高通表示识别面积达到了第一代产品的1 ...
Marvell将推出新SSD主控：支持QLC，随机IOPS超670K

Tom's Hardware报道Marvell已经完成了新一代SSD主控的设计,新主控将用于消费市场,云数据中心和企业市场,而且该产品还支持准备大规模推向市场的QLC.Marvell还在CES上展示了 ...
英伟达Shield TV迎来第25次升级：支持AI把360p视频超分到4K

英伟达最新为其去年发布的Shield TV以及Shield TV Pro流媒体播放器推送了第25次的系统更新,针对家庭影院发烧友以及流媒体视频用户带来了一系列功能更新以及体验升级.另外,针对旧款产品, ...
超炫数学动图，秒懂科学原理，收藏吧用得上哦！

想当年我们在数学的海洋里如饥似渴的遨游,什么公式.字母和图形,接招拆招.扫平了无数数学难题,八面威风,牛叉的不行不行的!!!下面的45组数学动图,来检验一下自己的成色还剩多少? 1 三角形内角和为18 ...
高中化学———超全超清学习导图

(19-21/43) [玫瑰]化学能和热能,原电池,电解池,一起上--

支持异构图、集成GraphGym！超好用的图神经网络库PyG更新2.0版本

相关推荐