ACL 2019论文| 为知识图谱添加注意力机制

2024-04-10 03:22:38

注意力机制（Attention）是近些年来提出的一种改进神经网络的方法，在图像识别、自然语言处理和图网络表示等领域都取得了很好的效果，可以说注意力机制的加入极大地丰富了神经网络的表示能力。

论文原文：

https://arxiv.org/pdf/1906.01195.pdf

论文背景

知识图谱（Knowledge Graph）可以用结构化的方式来描述真实世界的知识，如一个三元组（小罗伯特·唐尼，国籍，美国）便能够说明小罗伯特·唐尼的国籍是美国这样一件事实。然而这样的结构化表示并不是很利于计算，因而近些年来知识图谱表示学习受到了广泛的研究。

ConvE[1]和ConvKB[2]等基于卷积神经网络（CNN）的表示学习方法可以为知识图谱生成更丰富和表现力更强的向量表示，也取得了很好的实验效果。但是这些模型仅仅独立地表示每一个三元组，而忽略了三元组周围的邻居中蕴含的复杂语义信息，这在一定程度上限制了这类模型的性能。为此，今天我们要介绍的这篇论文将注意力机制引入到了每个三元组的邻居中，每个实体的表示都与其邻居息息相关。值得注意的是，传统的表示学习模型在进行实体链接预测时，是没有解释性的，仅仅可以给出结果。但是加入了注意力机制后，我们便可以使用每个邻居的注意力权重为模型的预测结果做出一定的解释。

论文模型

本篇论文的模型大致可以分为两部分，第一部分为加入注意力机制的编码器（Encoder），第二部分为解码器（Decoder）。论文的重点和主要贡献便是第一部分，加入注意力机制的编码器。

该模型的注意力机制是基于之前的图的注意力网络（GAT[3]）,GAT是GCN[4]的一个改进版本，它解决了GCN平等地从邻居中获取信息的缺点。更详细的说，GAT会为一个节点的每条边都学习一个注意力权重，然后按照这些权重从邻居中获取信息：

在上式中，alpha_ij即是连接i和j两个节点的边的权重，N_i是i节点的邻居节点集合，W为一个线性映射矩阵，最终该式输出的便是i节点的邻居化表示。

虽然GAT模型在传统的网络表示学习中很成功，但是还是不太能直接地应用到知识图谱中，因为它显然地忽略了边所蕴含的信息。在知识图谱中，一个实体在链接不同的边时往往有着不同的含义，如上图所示，Christopher Nolan在链接不同的边时可以有兄长或导演的含义。因而该篇论文在GAT的基础上进行了改进，加入了关系的信息。对于每一个三元组，学习一个表示如下：

其中h_i，h_j和g_k分别为头尾实体以及关系的向量表示，W_1为线性变换矩阵。之后经过一个LeakyRelu非线性层，可以得到：

之后可以计算每个三元组的注意力权重：

这里N_i为实体i的邻居节点，R_in为链接实体i和n的关系。此外该模型还加入了multi-head attention机制，可以使学习过程更加稳定，并且学习更多的邻居信息。最终每个实体的邻居表示为：

这里M便是代表有M个独立的注意力计算机制，对于关系向量，原论文仅将其乘以一个线性变换矩阵，未再加入注意力机制。

此外，在学习实体的邻居表示时，我们损失了实体初始的向量表示，因而在最终输出之前，会将初始的向量表示乘以一个变换矩阵加实体的邻居表示中。最终模型图如下，其中黄色的圆圈代表初始的实体向量，绿色圆圈代表初始的关系向量。原作者的模型图画的有些不清晰明了，若要详细了解还需阅读论文：

论文使用ConvKB作为模型的解码器（Decoder），对于每一个三元组，在上述编码器得到实体和关系向量的基础上，做出如下打分：

其中omega^m为第m个卷积核，模型最终使用soft-margin loss进行训练。

论文实验

该论文在FB15K-237、WN18RR、NELL-995和Kinship等数据集上进行了链接预测实验，实验结果如下所示。从表中可以看出，在多数情况下该模型可以达到目前最佳的实验效果，这说明融合邻居信息的表示能够很好的提升模型的性能，注意力机制对于知识图谱也是很有效果的。

参考文献

[1] Dettmers T, Minervini P, Stenetorp P, et al. Convolutional 2d knowledge graph embeddings[C]//Thirty-Second AAAI Conference on Artificial Intelligence. 2018.

[2] Nguyen D Q, Nguyen T D, Nguyen D Q, et al. A novel embedding model for knowledge base completion based on convolutional neural network[J]. arXiv preprint arXiv:1712.02121, 2017.

[3] Veličković P, Cucurull G, Casanova A, et al. Graph attention networks[J]. arXiv preprint arXiv:1710.10903, 2017.

[4] Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks[J]. arXiv preprint arXiv:1609.02907, 2016.

学术头条已建立微信交流群，想进群的同学请加学术君微信：AMiner308，记得备注：名字+单位/学校噢！

分享干货

小米在知识表示学习的探索与实践

编辑整理:孟航程出品平台:DataFunTalk 导读:知识表示是知识获取与应用的基础,贯穿了小米知识图谱的构建与应用.本文将结合小米知识图谱的构建及小爱问答场景,介绍融合文本和知识图谱的知识表示学 ...
学习｜知识图谱学习路线

学习｜知识图谱学习路线
视觉增强词向量：我是词向量，我开眼了！

设为 "星标",重磅干货,第一时间送达! 转载自 | 夕小瑶的卖萌屋文 | 橙橙子亲爱的读者,你是否被各种千亿.万亿模型的发布狂轰乱炸,应接不暇,甚至有点产生对大模型的审美疲劳 ...
一年六篇顶会的清华大神提出Fastformer：史上最快、效果最好的Transformer

新智元报道来源:arXiv 编辑:LRS [新智元导读]Transformer模型好是好,可惜太慢了!最近一位清华大神在arxiv上传了一篇论文,提出新模型Fastformer,线性时间复杂度,训练 ...
CV圈杀疯了！继谷歌之后，清华、牛津等学者又发表三篇MLP相关论文，LeCun也在发声

来源:AI科技评论本文介绍了来自牛津.清华的多位学者关于MLP的多篇论文. 5月4日,谷歌团队在arXiv上提交了一篇论文<MLP-Mixer: An all-MLP Architecture ...
知识表示与融入技术前沿进展及应用

作者|李杨[1],李晶阳[1],牛广林[2],唐呈光[1],付彬[1],余海洋[1],孙健[1] 单位|阿里巴巴-达摩院-小蜜Conversational AI团队[1],北京航空航天大学计算机学院[ ...
【Transformer】从零详细解读

本文是对B站视频"transformer从零详细解读"的笔记,视频:https://www.bilibili.com/video/BV1Di4y1c7Zm?p=1 一.概述 TRM ...
苹果让Transformer抛弃注意力机制，一切只为效率，项目已开源丨华人一作

来源:量子位(QbitAI) 2017年,一句Attention Is All You Need引爆了整个NLP圈,甚至在近些年还有踢馆计算机视觉领域的趋势. 所有的这一切,都来源于这篇论文中的Tra ...
【每周NLP论文推荐】介绍语义匹配中的经典文章

欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 语义匹配也是NLP中比较基础的任务,它的主 ...
ACL 2019论文| 揭秘认知图谱！从多跳阅读理解问答开始

"机器的阅读理解与问答"一直以来被认为是"自然语言理解(NLU)"的核心问题之一,随着BERT等模型的兴起,单段落的简单阅读理解任务取得了重大突破:研究者将目光 ...
【学术论文】知识图谱精化研究综述

摘要: 知识图谱是一种在移动互联网大时代下产生的新型知识表示方法,而精化是知识图谱应用研究的主要内容之一,其主要任务是知识图谱补全和错误检测等,在信息检索.机器人.智能问答等领域有着重要的应用前景.因 ...
【星球知识卡片】注意力机制发展如何了，如何学习它在各类任务中的应用？

【星球知识卡片】注意力机制发展如何了，如何学习它在各类任务中的应用？
NAACL 2019 论文 | 基于胶囊网络的知识图谱表示学习

知识图谱表示学习(Knowledge Graph Embedding)是将知识图谱中的实体和关系等表示为低维的向量空间中的向量,这些向量蕴含了实体和关系的复杂信息,有利于计算机进行计算和推理. 论文背 ...
这篇论文提出了一个文本<->知识图谱的格式转换器...

Hello, 大家好,我是小花.今天给大家介绍一篇有野心的paper.为何如此说呢?因为该工作提出了一个知识的格式转换器,用于转换无结构化的纯文本(Text)和结构化的知识图谱(KG) .换句话说, ...
论文推荐｜面向遥感大数据的地学知识图谱构想

引用格式: 王志华,杨晓梅,周成虎.面向遥感大数据的地学知识图谱构想[J].地球信息科学学报,2021,23(1):16-28. [ Wang Z H, Yang X M,Zhou C H. Geog ...
论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文笔记整理:王琰,东南大学硕士. 来源:CIKM 2020 链接:https://doi.org/10.1145/3340531.3411947 研究背景与任务描述为了解决推荐系统中的数据稀疏和冷 ...
EMNLP 2020论文分析：知识图谱增强语言模型或是未来的发展趋势！

在EMNLP 2020的论文投递中,知识图谱的研究热度不减,并成为继续推动NLP发展的重要动力之一. 在EMNLP 2020中,知识图谱领域有了哪些最新研究进展呢?作者从中选出了30篇文章,对未来2- ...
ACL 2019 | 将带推敲解码器的增量Transformer用于文档级知识对话

本文将对 ACL2019论文<Incremental Transformer with Deliberation Decoder for Document Grounded Conversati ...

ACL 2019论文| 为知识图谱添加注意力机制

注意力机制（Attention）是近些年来提出的一种改进神经网络的方法，在图像识别、自然语言处理和图网络表示等领域都取得了很好的效果，可以说注意力机制的加入极大地丰富了神经网络的表示能力。

相关推荐