本体和知识图谱之间的区别是什么?

译者:AI 研习社(洛克 • 麦金托、小海绵)
双语原文链接:What ’ s the Difference Between an Ontology and a Knowledge Graph?
随着语义应用程序成为业界越来越热门的话题,客户经常来 EK 询问有关本体和知识图谱的问题。具体来说,他们想知道两者之间的区别。本体和知识图谱是一回事吗?它们有何不同?两者之间是什么关系?
在这篇博客中,我将引导您了解本体和知识知识图谱,讲述它们之间的区别以及它们如何组织大量数据和信息。
什么是本体?
本体是语义数据模型,用于定义 domain 中事物的类型以及可用于描述它们的属性。本体是广义的数据模型,这意味着它们仅对具有某些属性的事物的一般类型进行建模,而并不包含有关我们 domain 中具体个体的信息。例如,本体论不能描述您的狗,斑点和它的所有个体特征,主要描述狗的一般概念,尝试描述大多数狗可能具有的特征。这样做可以使我们在将来用本体来描述其他狗。
本体有三个主要组成部分,通常描述如下 :
类: 存在于数据中的不同类型的。
关系:连接两个类的属性。
属性:描述单个类的属性。
例如,假设我们有以下关于书籍、作者和出版商的信息:
首先,我们要标识类 ( 数据中事物的唯一类型 ) 。这个示例数据似乎捕获了关于书籍的信息,因此它是类的一个很好的候选项。具体来说,示例数据捕获了关于书籍的某些类型的内容,比如作家和出版商。再深入一点,我们可以看到我们的数据还捕获了关于出版商和作者的信息,比如他们的位置。这给我们留下了这个例子中的四个类:
书籍
作者
出版商
位置
下一步,我们需要标识关系和属性 ( 为了简单,我们可以将关系和实体属性都视为属性 ) 。使用我们在之前定义的类,我们可以查看数据并开始列出我们看到的每个类的所有属性。例如,在书籍类中,一些属性可能是 :
书籍有作者
书籍有出版商
书集是在一个日期出版的
书籍之后有续集 ( 其他书 )
其中一些属性是连接两个类的关系。例如,关系属性'书籍有作者'是一个连接书籍类和作者类的关系。其他属性,像'书籍发布的日期'是实体属性,只描述一个类,而不是将两个类连接在一起。
需要注意的是,这些属性可能适用于任何给定的书籍,但它们不一定适用于每一本书。例如,很多书都没有续集。这在我们的本体中很好,因为我们只是想确保我们捕获了可能适用于许多 ( 但不一定是所有 ) 书籍的属性。
虽然上面的属性列表很容易阅读,但是重写这些属性以更清楚地定义我们的类和属性会有所帮助。例如,'书籍有作者'可以写成 :
书→有作者→作者
尽管你可以包括更多的属性,这取决于你的用例,对于这个博客,我已经定义了以下属性 :
书→有作者→作者
书→有出版商→出版商
书→出版于→出版日期
书→后面是→书
出版商 →位于→位置
位置→位于→位置
记住,我们的本体是一个通用的数据模型,这意味着我们不想在本体中包含关于特定书籍的信息。相反,我们希望创建一个可重用的框架,将来我们可以用它来描述其他书籍。
当我们结合类和关系时,我们能够以图的形式查看本体 :
什么是知识图谱?
使用本体作为一个框架,我们可以添加关于个别书籍、作者、出版商和位置的真实数据来创建一个知识图谱。利用上面表中的信息和本体,我们可以创建每个本体关系的特定实例。比如,如果我们的本体中有这样的关系'书籍→有作者→作者',这个关系的单个实例如下:
如果我们把我们拥有的关于《杀死一只知更鸟》这本书的所有信息加进去,我们可以看到知识图谱的开端:
如果我们对所有的数据都这么做,我们最终会得到一个使用本体对数据进行编码的图。通过使用知识图谱,我们可以将数据看作一个关系网络,而不是作为单独的表格在我们无法理解的数据点间绘制新的连接。具体来说,使用 SPARQL,我们可以查询数据和使用推理功能(让知识图谱建立之前没有定义的连接)。
那么本体和知识图谱有什么不同呢?
正如你在上面例子中所看的,当你将本体(我们的数据模型)应用到一组单独的数据点(书籍、作者和出版商数据)时,那么就是创建了一个知识图谱。换句话说:
本体 数据 = 知识图谱
AI 研习社是 AI 学术青年和 AI 开发者技术交流的在线社区。我们与高校、学术机构和产业界合作,通过提供学习、实战和求职服务,为 AI 学术青年和开发者的交流互助和职业发展打造一站式平台,致力成为中国最大的科技创新人才聚集地。
如果,你也是位热爱分享的 AI 爱好者。欢迎与译站一起,学习新知,分享成长。
(0)

相关推荐

  • 终于有人把知识图谱讲明白了

    导读:知识图谱的概念诞生于2012年,由Google公司首先提出.知识图谱的提出是为了准确地阐述人.事.物之间的关系,最早应用于搜索引擎.知识图谱是为了描述文本语义,在自然界建立实体关系的知识数据库. ...

  • 智慧城市知识图谱模型与本体构建方法

    智慧城市知识图谱模型与本体构建方法 臧根林1,2, 王亚强1,2, 吴庆蓉1,2, 占春丽1,2, 李熠3 1 拓尔思知识图谱研究院 2 广州拓尔思大数据有限公司 3 湘潭大学 摘要:针对目前智慧城市 ...

  • 【KDD 2019】JOIE:联合知识图谱实例和本体概念的通用表示学习

    许多大规模知识图谱将知识组织成两个视图:以抽象概念和常识概念组成的本体视图,和以本体概念实例化的特定实体组成的实例视图.现有的知识图谱表示方法仅侧重于其中一个视角下的知识表示,JOIE使用跨视图关联模 ...

  • 名老中医医案 知识图谱

    随着信息时代的来临,知识呈现出爆炸式增长的现象,计算机处理技术水平和存储能力也得到了迅速提高,且实现了越来越便捷的信息分析.检索,甚至可视化等先进的功能,使得近年来出现了以知识单元为前提.可以快速获取 ...

  • 何捷:知识图谱——精准定位教学的“GPS”

    2012年,谷歌(Google)正式提出了知识图谱的概念,并宣布以此为基础构建下一代智能化搜索引擎.我们所理解的知识图谱是人工智能领域的一个重要分支,其来源于智能化的图书情报和信息处理技术,即将文献中 ...

  • 【直播课】知识图谱第三期直播-关系抽取及分类

    前言 最近几年知识图谱作为人工智能领域很热门的一项技术,已经在不少领域都取得了不少成功的落地案例.不过知识图谱作为人工智能的一个底层技术,确实不如图像,语音等技术一样让人能很直观的感受到它的存在.于是 ...

  • ENRIE:知识图谱与BERT相结合,为语言模型赋能助力

    来自:朴素人工智能 感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们将沿此脉络前行,探索预训练语言模型的前沿技术,红框中为已介绍的文章,绿框中为本期介绍的模型,欢迎大家留言讨论交流. E ...

  • 断路器,负荷开关,隔离开关之间的区别是什么?都用在什么地方?

    断路器.负荷开关.隔离开关都是用来闭合与切断电路的电器,但它们在电路中所起的作用是不同的.其中:断路器可以切断负荷电流和短路电流:负荷开关只可切断负荷电流,短路电流是由熔断器来切断的:隔离开关则不能切 ...

  • 中新广州知识城及协同发展区总规划获全国优秀城市规划设计一等奖

    广州讯   近日,中国城市规划协会公布"2019年度优秀城市规划设计奖"评选结果,中新广州知识城及协同发展区总体规划(2018-2035年)获该奖项一等奖. 一是优化空间布局.全面 ...

  • 构建体系化医学知识图谱 提高医学人文素养

    深圳图书馆健康分馆位于深圳市疾控中心,由预防医学历史展厅和标本展厅组成,将强烈艺术感染力和趣味互动性融为一体,拉近公众与医学之间的距离.与此同时,作为全国公共卫生领域首家叙事医学机构所在地,该场馆将定 ...