认知图谱:第三代AI的“大”机遇
自 1956 年 AI 的概念首次被提出后,AI 至今已有 60 多年的发展史。如今,随着相关理论和技术的不断革新,AI 在数据、算力和算法“三要素”的支撑下越来越多地走进我们的日常生活,比如我们常见的语音识别、人脸识别和机器翻译等,都已经在手机、电脑等智能设备上有所应用。
但是,这一系列惊喜的背后,却是大多数 AI 在语言理解、视觉场景理解、决策分析等方面的举步维艰:这些技术依然主要集中在感知层面,即用 AI 模拟人类的听觉、视觉等感知能力,却无法解决推理、规划、联想、创作等复杂的认知智能化任务。当前的 AI 缺少信息进入“大脑”后的加工、理解和思考等,做的只是相对简单的比对和识别,仅仅停留在“感知”阶段,而非“认知”,以感知智能技术为主的 AI 还与人类智能相差甚远。
究其原因在于,AI 正面临着制约其向前发展的瓶颈问题:大规模常识知识库与基于认知的逻辑推理。而基于知识图谱、认知推理、逻辑表达的认知图谱,则被越来越多的国内外学者和产业领袖认为是“目前可以突破这一技术瓶颈的可行解决方案之一”。
目前,人工智能的发展经历了从表示、计算到感知两个阶段,下一个阶段的核心是认知。早在 2016 年,中国科学院院士、清华大学人工智能研究院院长张钹就提出了第三代 AI 体系的雏形,并于 2018 年底正式公开第三代 AI 的理论框架体系,其核心思想为:建立可解释、鲁棒性的 AI 理论和方法;发展安全、可靠、可信及可扩展的 AI 技术;推动 AI 创新应用。
2019 年,图灵奖得主约书亚·本吉奥(Yoshua Bengio)在 NeurIPS 大会上也指出,深度学习应该以感知为主向,向基于认知的逻辑推理和知识表达的方向发展,这个思想和张钹院士提出的第三代 AI 的思路不谋而合。
尽管目前的智能系统在感知方面已经达到甚至超越人类水平,但在鲁棒性、可解释性、安全可靠等方面还存在很多不足。比如,模型鲁棒性差,难以与准确性共生;模型可解释性差,对于可靠性要求高的任务很难胜任;缺乏积累知识的能力,也没能和人类已有的知识体系进行很好的关联,缺乏可靠的推理方法。
认知图谱的历程发展可以追溯到语义网络(Semantic Network)。1968 年,M. Ross Quillian 在研究人类长期记忆模型时,描述了人类长期记忆的一般结构模型,认为记忆由概念之间的联系来实现,并存储在复杂的网络中,并基于此提出了语义网络的概念。
同年,专家系统之父、图灵奖得主爱德华·费根鲍姆(Edward Feigenbaum)等人研发出了世界首个专家系统 DENDRAL。专家系统是早期 AI 的一个重要分支,它可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用 AI 中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。
1998 年,万维网之父、ACM 图灵奖获得者蒂姆·伯纳斯-李(Tim Berners-Lee)爵士也提出了语义网的概念,其核心理念是通过给万维网上的文档(如:HTML 文档、XML 文档)添加能被计算机理解的语义“元数据”(Meta Data),使整个互联网成为一个通用的信息交换媒介,即用知识表示互联网,建立常识知识库。
2006 年,蒂姆·伯纳斯-李提出链接数据(Linked Data)的概念,表示数据不仅仅发布于语义网中,还要建立起数据之间的链接,从而形成一张巨大的链接数据网,其目的是构建一张计算机能理解的语义数据网络,而不仅仅是人能读懂的文档网络,从而在此之上构建更智能的应用。
2012 年,Google 的阿米特·辛格尔(Amit Singhal)等人介绍了知识图谱(Knowledge Graph)的概念。知识图谱以语义网络的结构化方式描述客观世界中概念、实体、事件以及它们之间的关系,相对于传统的本体和语义网络而言,实体覆盖率更高,语义关系也更加复杂而全面。
这个思路的基本思想是结合认知科学中的双通道理论:人脑的认知系统中存在两个系统,即 System 1 和 System 2。System 1 是一个直觉系统,它可以通过人对相关信息的直觉匹配寻找答案,非常快速、简单;而 System 2 是一个分析系统,它通过一定的推理、逻辑找到答案。
要回答这一问题,首先需要 System 1 找到相关的影片,然后 System 2 做出决策,如果是标准答案,就结束整个推理过程;如果不是,而相应的信息又有用,就把它作为一个有用信息提供给 System 1,System 1 继续做知识扩展,System 2 则再次做出决策,直到找到最终答案。
由此可见,认知图谱的核心是以实现融合知识驱动和数据驱动相结合的知识表示和推理的认知引擎为目标,研究支持鲁棒可解释人工智能的大规模知识的表示、获取、推理与计算的基础理论和方法;建设包含语言知识、常识知识、世界知识、认知知识的大规模知识图谱以及典型行业知识库,建成知识计算服务平台。
研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键,实现以认知图谱作为底层数据支撑,具有推理、具有可解释性、具有认知的新一代 AI,是 AI 领域下一个 10 年重要的发展方向,也是一个机遇与挑战并存的发展方向。
众所周知,技术的突破与发展离不开来自人才的持续创新,科技竞争归根结底也是人才的竞争。那么,放眼中国乃至全世界,认知图谱领域的人才在哪里?
近日,清华大学人工智能研究院、北京智源人工智能研究院、清华-中国工程院知识智能联合研究中心、阿里集团-新零售智能引擎事业群联合发布了《人工智能之认知图谱》(Research Report of Cognitive Graph)报告(文末福利,免费下载完整版报告)。该报告依托 AMiner 平台,对技术领先的国家、机构和学者,以及认知图谱相关领域的技术发展趋势、技术创新热点等进行了详细分析。
数据显示,全球范围内认知图谱相关领域的学者主要集中在北美、欧洲和亚洲。美国的高水平学者数量在全球位居首位,其次是中国,第三是英国。
数据显示,美国、加拿大、法国的学者流入数量大于流出数量,而中国、英国、德国、意大利、印度、日本、西班牙的学者流出数量大于流入数量。
那么,国内认知图谱相关领域的学者分布情况又如何呢?数据显示,北京是学者流入和流出数量都很高的城市,比其他城市高出较多,这可能与北京的高校和科研院所数量较多有一定关系。此外,北京、香港、上海、哈尔滨的学者流出数量高于流入数量,而武汉、南京、西安、杭州、广州、合肥的学者流入数量高于流出数量。北京、香港、上海的学者流失与这三个城市的高校数量较多、供求关系不平衡、人才竞争力和生活压力较大不无关联,而哈尔滨的地域环境造成了一定的学者流失。针对学者净流入数量为正值的这几个城市,通过调研相关资料,可以发现这些地方在积极推行人才引进政策,包括落户、房补、薪酬等方面均制定了相应的优惠措施。
未来 10 年,具有推理、具有可解释性、具有认知的新一代 AI,是 AI 领域的下一个重要发展方向,而研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键,但归根结底还要依靠相关人才基于不懈努力做出的创新。