认知图谱：第三代AI的“大”机遇

2024-05-19 15:03:56

近年来，人工智能（AI）依靠深度学习、计算机视觉、自然语言处理等技术突破与落地应用，不断颠覆着人类的既有认知——AlphaGo 通过自我强化学习击败了人类的顶尖围棋选手；而近日 Alphafold 更是破解了一项过去 50 年生物学领域的重大挑战——蛋白质分子折叠问题。

自 1956 年 AI 的概念首次被提出后，AI 至今已有 60 多年的发展史。如今，随着相关理论和技术的不断革新，AI 在数据、算力和算法“三要素”的支撑下越来越多地走进我们的日常生活，比如我们常见的语音识别、人脸识别和机器翻译等，都已经在手机、电脑等智能设备上有所应用。

但是，这一系列惊喜的背后，却是大多数 AI 在语言理解、视觉场景理解、决策分析等方面的举步维艰：这些技术依然主要集中在感知层面，即用 AI 模拟人类的听觉、视觉等感知能力，却无法解决推理、规划、联想、创作等复杂的认知智能化任务。当前的 AI 缺少信息进入“大脑”后的加工、理解和思考等，做的只是相对简单的比对和识别，仅仅停留在“感知”阶段，而非“认知”，以感知智能技术为主的 AI 还与人类智能相差甚远。

究其原因在于，AI 正面临着制约其向前发展的瓶颈问题：大规模常识知识库与基于认知的逻辑推理。而基于知识图谱、认知推理、逻辑表达的认知图谱，则被越来越多的国内外学者和产业领袖认为是“目前可以突破这一技术瓶颈的可行解决方案之一”。

目前，人工智能的发展经历了从表示、计算到感知两个阶段，下一个阶段的核心是认知。早在 2016 年，中国科学院院士、清华大学人工智能研究院院长张钹就提出了第三代 AI 体系的雏形，并于 2018 年底正式公开第三代 AI 的理论框架体系，其核心思想为：建立可解释、鲁棒性的 AI 理论和方法；发展安全、可靠、可信及可扩展的 AI 技术；推动 AI 创新应用。

2019 年，图灵奖得主约书亚·本吉奥（Yoshua Bengio）在 NeurIPS 大会上也指出，深度学习应该以感知为主向，向基于认知的逻辑推理和知识表达的方向发展，这个思想和张钹院士提出的第三代 AI 的思路不谋而合。

图 | AI 的发展阶段

如今，第三代 AI 的理念在国内外获得广泛影响力。业内普遍认为，认知智能将是进一步释放人工智能产能的关键，而认知图谱是实现认知智能技术突破的关键，不仅可以让机器理解数据本质，还可以让机器解释现象本质。

认知图谱：实现认知智能的关键

机器认知智能的发展过程本质上是人类脑力不断解放的过程，是人工智能的最高阶段。但是，让机器具备认知智能，其核心就是让机器具备理解和解释能力。这种能力的实现与大规模、结构化的背景知识是密不可分的。

尽管目前的智能系统在感知方面已经达到甚至超越人类水平，但在鲁棒性、可解释性、安全可靠等方面还存在很多不足。比如，模型鲁棒性差，难以与准确性共生；模型可解释性差，对于可靠性要求高的任务很难胜任；缺乏积累知识的能力，也没能和人类已有的知识体系进行很好的关联，缺乏可靠的推理方法。

认知图谱旨在结合认知心理学、脑科学和人类知识等，研发融合知识图谱、认知推理、逻辑表达的新一代认知引擎，支持大规模知识的表示、获取、推理与计算的基础理论和方法，实现人工智能从感知智能向认知智能的演进，建立可解释、鲁棒性的认知智能

作为一种实现机器认知智能的底层支撑手段，认知图谱在电商平台、智慧城市、司法行业、金融行业、安防行业、大数据的精准与精细分析、智慧搜索、智能推荐、智能解释、自然人机交互等方面具有极为重要的作用。

认知图谱的历程发展可以追溯到语义网络（Semantic Network）。1968 年，M. Ross Quillian 在研究人类长期记忆模型时，描述了人类长期记忆的一般结构模型，认为记忆由概念之间的联系来实现，并存储在复杂的网络中，并基于此提出了语义网络的概念。

同年，专家系统之父、图灵奖得主爱德华·费根鲍姆（Edward Feigenbaum）等人研发出了世界首个专家系统 DENDRAL。专家系统是早期 AI 的一个重要分支，它可以看作是一类具有专门知识和经验的计算机智能程序系统，一般采用 AI 中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。

1998 年，万维网之父、ACM 图灵奖获得者蒂姆·伯纳斯-李（Tim Berners-Lee）爵士也提出了语义网的概念，其核心理念是通过给万维网上的文档（如：HTML 文档、XML 文档）添加能被计算机理解的语义“元数据”（Meta Data），使整个互联网成为一个通用的信息交换媒介，即用知识表示互联网，建立常识知识库。

2006 年，蒂姆·伯纳斯-李提出链接数据（Linked Data）的概念，表示数据不仅仅发布于语义网中，还要建立起数据之间的链接，从而形成一张巨大的链接数据网，其目的是构建一张计算机能理解的语义数据网络，而不仅仅是人能读懂的文档网络，从而在此之上构建更智能的应用。

2012 年，Google 的阿米特·辛格尔（Amit Singhal）等人介绍了知识图谱（Knowledge Graph）的概念。知识图谱以语义网络的结构化方式描述客观世界中概念、实体、事件以及它们之间的关系，相对于传统的本体和语义网络而言，实体覆盖率更高，语义关系也更加复杂而全面。

图 | 认知图谱的演化历程（来源：报告《人工智能之认知图谱》）

但是，要让机器具备认知智能，其核心就是让机器具备理解和解释能力，这种能力的实现与大规模、结构化的背景知识是密不可分的。2020 年，清华大学计算机系教授、系副主任唐杰在“人工智能下一个十年”报告中，结合认知科学和计算机理论，提出了一个实现认知智能的可行思路，即“认知图谱 = 知识图谱 + 认知推理 + 逻辑表达”，并希望利用知识表示、推理和决策，以及人的认知来解决复杂问题。

这个思路的基本思想是结合认知科学中的双通道理论：人脑的认知系统中存在两个系统，即 System 1 和 System 2。System 1 是一个直觉系统，它可以通过人对相关信息的直觉匹配寻找答案，非常快速、简单；而 System 2 是一个分析系统，它通过一定的推理、逻辑找到答案。

比如，回答一个具体问题：2003 年在洛杉矶 Quality 咖啡馆拍过电影的导演是谁？

要回答这一问题，首先需要 System 1 找到相关的影片，然后 System 2 做出决策，如果是标准答案，就结束整个推理过程；如果不是，而相应的信息又有用，就把它作为一个有用信息提供给 System 1，System 1 继续做知识扩展，System 2 则再次做出决策，直到找到最终答案。

由此可见，认知图谱的核心是以实现融合知识驱动和数据驱动相结合的知识表示和推理的认知引擎为目标，研究支持鲁棒可解释人工智能的大规模知识的表示、获取、推理与计算的基础理论和方法；建设包含语言知识、常识知识、世界知识、认知知识的大规模知识图谱以及典型行业知识库，建成知识计算服务平台。

机遇与挑战并存

近年来，虽然 AI 已经取得了快速发展，但如何将深度学习与大规模常识知识结合起来，实现认知推理与逻辑表达，还面临着很大挑战。

研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键，实现以认知图谱作为底层数据支撑，具有推理、具有可解释性、具有认知的新一代 AI，是 AI 领域下一个 10 年重要的发展方向，也是一个机遇与挑战并存的发展方向。

众所周知，技术的突破与发展离不开来自人才的持续创新，科技竞争归根结底也是人才的竞争。那么，放眼中国乃至全世界，认知图谱领域的人才在哪里？

近日，清华大学人工智能研究院、北京智源人工智能研究院、清华-中国工程院知识智能联合研究中心、阿里集团-新零售智能引擎事业群联合发布了《人工智能之认知图谱》（Research Report of Cognitive Graph）报告（文末福利，免费下载完整版报告）。该报告依托 AMiner 平台，对技术领先的国家、机构和学者，以及认知图谱相关领域的技术发展趋势、技术创新热点等进行了详细分析。

数据显示，全球范围内认知图谱相关领域的学者主要集中在北美、欧洲和亚洲。美国的高水平学者数量在全球位居首位，其次是中国，第三是英国。

图 | 全球认知图谱相关领域学者分布地图（来源：报告《人工智能之认知图谱》）

其中，中美两国的高水平学者数量远高于其他国家，在认知图谱相关领域具有较强的发展潜力。中国虽然仅次于美国，但是高水平学者数量约是美国的一半，相差较大。

图 | h-index TOP 5000 全球学者的国家统计前 10 名

而国内认知图谱相关领域学者主要分布在中国的经济和政治发达地区，包括京津冀、长江三角洲、珠江三角洲、香港、台湾等地区，中部、西部和东北地区的学者则相对较少。

图 | 中国认知图谱相关领域学者分布地图（来源：报告《人工智能之认知图谱》）

具体而言，北京、上海和江苏的认知图谱相关领域学者数排名前三位，分别为 129、45 和 36。（参考 h-index 作为筛选条件，选择 TOP 5000 全球学者以地图形式展示和分析学者的地区分布，其中颜色越红、圆圈越大，表示人才越集中。）

图 | h-index TOP 5000 中国学者的省市统计前 10 名

而且，美国在认知图谱相关领域的论文发表量和总被引频次、高水平学者数量均位居世界前列。中国虽然在论文发表量和高水平学者数量方面仅次于美国，但与美国差距较大，并且论文总被引频次要低于英国和德国，在全球排名第四。

图 | 论文总被引频次排名前 10 的国家

此外，报告还基于 AMiner 平台将学者流入和流出数量之和作为筛选条件，统计了认知图谱相关领域的全球学者在 2009-2020 年间的流动数量排名前 10 的国家。

数据显示，美国、加拿大、法国的学者流入数量大于流出数量，而中国、英国、德国、意大利、印度、日本、西班牙的学者流出数量大于流入数量。

图 | 全球认知图谱领域学者的流动情况（来源：报告《人工智能之认知图谱》）

由此看出，中国近 10 年来的学者流动较为频繁，这与中国制定的出国培养、人才引进等相关人才政策不无关系。随着经济全球化深入发展，科技人才的跨国流动更加频繁，各国对科技人才的争夺更加激烈。

那么，国内认知图谱相关领域的学者分布情况又如何呢？数据显示，北京是学者流入和流出数量都很高的城市，比其他城市高出较多，这可能与北京的高校和科研院所数量较多有一定关系。此外，北京、香港、上海、哈尔滨的学者流出数量高于流入数量，而武汉、南京、西安、杭州、广州、合肥的学者流入数量高于流出数量。北京、香港、上海的学者流失与这三个城市的高校数量较多、供求关系不平衡、人才竞争力和生活压力较大不无关联，而哈尔滨的地域环境造成了一定的学者流失。针对学者净流入数量为正值的这几个城市，通过调研相关资料，可以发现这些地方在积极推行人才引进政策，包括落户、房补、薪酬等方面均制定了相应的优惠措施。

图 | 中国认知图谱领域学者的流动情况（来源：报告《人工智能之认知图谱》）

以上分析表明，在下一代 AI 的机遇与挑战下，中国相关部门需要重视并采取相关措施，让中国学者在重视论文数量的同时，也要提升论文质量，同时也要加快高水平科技人才队伍的建设，一方面针对国际新局势从政策、资金、资源等多个方面加快本土培养，另一方面加大力度引进国外重要机构的杰出学者，改善人才结构，加速认知图谱领域的技术发展。

未来 10 年，具有推理、具有可解释性、具有认知的新一代 AI，是 AI 领域的下一个重要发展方向，而研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键，但归根结底还要依靠相关人才基于不懈努力做出的创新。

百度智能云新架构掀开面纱：知识中台成为差异化竞争优势

百度智能云的知识中台,就是要帮助企业挖掘知识这座沉睡的金矿. 企业是否需要数据已不再是问题,新的问题是:企业需要什么样的数据?知识是答案之一. 比如在营销服务这个场景中,千人千面的智能营销与客服成为一 ...
清华大学李涓子：AI系统如何实现认知推理？

认知是人获取和应用知识的过程,知识图谱是人对客观世界认知的表示.人工智能系统如何实现知识的表示和推理? 在2021年世界人工智能大会上,由AI TIME组织的"图神经网络与认知智能前沿技术论 ...
［首藏作品］（7076）有了“AI大脑”，机器人小科会学习会思考

有了"AI大脑",机器人小科会学习会思考◎本报记者付丽丽 "十三五"科技创新成就展上的科普机器人小科受访单位供图"AI大脑"一方面依靠超 ...
AI开发者大会：2020年7月3日09:50--10:10唐杰《人工智能的下一个十年》

AI开发者大会:2020年7月3日09:50--10:10唐杰<人工智能的下一个十年> 导读:人工智能的第三次浪潮中,超越深度学习-ML和DL需要结合符号AI:自监督学习将会大放异彩. N ...
认知智能发展研究报告（2021）

认知智能是一种赋予机器模拟人类认知思考能力的技术,作为人工智能发展的高级阶段,具有交互性.情境性与适应性等特点.认知智能"能理解.会思考"的能力,可以极大地将人类从重复体力劳动和简 ...
百度饮得知识图谱的头啖汤！会让大家跟着吃鸡吗？

2017年,知识经济日益火爆,分答.知乎.得到等知识平台可谓如日中天.眼下这种火爆已在从人类延展到机器.互联网巨头纷纷对知识变得饥渴起来,知识成为数据之后的又一个香饽饽. 互联网巨头对知识越来越青睐 ...
知识图谱让分析工作化繁就简

这是一个数字化的时代,数据正成为这个时代最核心的资源.但各行业的数据虽然有大量积累,却犹如笼中巨兽,能量无法释放,究其原因,一方面是数据本身的复杂性造成,如数据存储在不同的平台.结构不统一.基于知识的 ...
智能设计 v3.0

hi,大家好~我是shadow,设计师/全栈工程师/算法研究员,目前主要研究方向是人工智能写作和人工智能设计,当然偶尔也会跨界到人工智能艺术及其他各种AI产品.这是一篇汇总了几年的一些思考,长达100 ...
2021年「大私域」应该怎么做发布《私域认知图谱2.0》｜盘点2020

说在面前的话: 去年写完一个盘点:<11000字长文详解「大"私域"」思考,涉及微信.企业微信.抖音以及认知层>颇受大家喜欢,以至于今年再怎么忙也在抽时间弄盘点,今年就 ...
三棵树董事长洪杰：中国涂料行业面临九大机遇及八大挑战

全国人大代表.三棵树涂料股份有限公司董事长兼总裁洪杰涂料行业新机遇机遇1:中国是全球主要经济体增长最快的国家,市场规模增长最快中国抗疫胜利,社会稳定,科技创新实力日益提升,经济仍处在中高速增长阶 ...
平讲平说2578期：职场上很多事都不能只看表面，一次不满意的谈话，居然给陆逊带来意想不到的大机遇

图片来自网络,如有版权即联系删除文 | 趙玉平平讲平说2578期# 从关云长北征襄樊,水淹七军,威震华夏,一直到吕子明白衣渡江,袭取荆州,关老爷败走麦城,这期间发生的一系列的大小战斗,总称为&qu ...
一副老花镜如何从30元卖到5000元？五千字长文揭秘老花镜市场新增4大机遇

一副老花镜卖5000元,复购还能高达50%. 在天猫搜索关键词"老花镜",显示近一个月销量最高的,是老花镜品牌故乡月旗下一款定价29.9元的老花镜,月成交量为2.1万副.这个价格, ...
100张PPT图解新基建，分析大机遇

-End- 本文来源:金属加工
冷静思考，关注大机遇！（博士周报）

今日节选<博士原创周报>第31期中的棕榈油.螺纹这2个品种的走势分析.周报18个品种完整版,已于周末发送到学院和实盘学习群,大家可以参考阅读.周报分析,有助于培养对1个品种的大局观: 声明 ...
4亿美元AI药物研发融资新纪录！斯坦福AI大姐大缔造，2022年或建首条管线

AI 制药领域又刷新了单笔融资记录. 近日,AI 制药公司 insitro 宣布完成 4 亿美元的 C 轮融资,成为全球 AI 制药领域单笔融资金额最高的公司. 本轮融资由 CPP Investmen ...
发布 | 大脑中文词汇理解（语义认知图谱）数据集，探索大脑语言理解机理

CASIA 解锁更多智能之美 [摘要]近日,自动化所团队构造了一个大脑中文词汇理解(语义认知图谱)数据集,该数据集有望为后续深入研究大脑语言理解机理提供数据基础. 语言认知是人类智能最显著的体现.大脑 ...
自媒体竞争越来越大，2021农民将迎来2大机遇，抓住了，收入不菲

自媒体竞争越来越大,2021农民将迎来2大机遇,抓住了,收入不菲自从自媒体开始出现以后,很快就占据了网络的大部分市场,也由此衍生出了一大批以自媒体为业的人,如今仍然属于一个非常火爆的行业,但是一些领 ...

认知图谱：第三代AI的“大”机遇

相关推荐