深度学习已成过去时?第三代人工智能,其发展路径备受关注
人工智能发展至今已有60多年的历史,目前比较公认的是此前已经历了两代的发展。
第一代人工智能主要是基于知识库和推理机,即将某个领域的知识或经验通过人工整理成计算机可以识别的符号及规则,通过符号演算和推理进行规划、决策、识别等类似于人类的智能工作,也就是在计算机中建立知识库和推理机制来模拟人类的推理和思考行为。典型的成果如1971年左右斯坦福大学的MYCIN医疗专家系统和1997年左右的IBM国际象棋系统,前者可诊断血液传染病并开出抗菌素处方,后者于1997年打败了国际象棋世界冠军卡斯帕罗夫。这类系统的共同之处在于:一是要将知识和经验放入系统,如把传染病知识、下过的棋局和形成的残局,通过人工分析整理变成计算机可以识别的知识;二是算法,其中包括符号演算和推理机制;三是存储能力和算力,依靠容量和速度远超人类的存储和计算能力,来超越人类的某项能力,如医疗知识库的内容肯定超过该领域任何一个医生所知,国际象棋系统每秒能够预测8~12步,而象棋大师每秒只能预测3~5步。
第一代人工智能的发展存在很大的局限性,或者说是缺陷。一个主要原因是:知识和经验都来自于专家,要将这些专家的知识和经验通过人工输入到计算机中,需要高度的协同和昂贵的成本,费时费力。因为专家是十分稀缺的资源,非常昂贵;同时领域专家并不是计算机专家,需要计算机领域专家理解领域专家知识后再用形式化方法表达,这个过程非常艰难。另一个主要原因是一些知识具有不确定性或模糊性,这些知识和很多常识很难形式化表达。这两个主要原因,加上一些其他原因,导致第一代人工智能的应用范围非常有限。
深度学习的兴起开启了第二代人工智能。所谓深度学习,就是通过深度神经网络模型模拟人类获取知识的过程,它的基础主要是神经网络和统计方法,可以广泛用于图像识别、文字识别、声音识别以及大数据分析等领域,并取得了非常好的效果。如在人脸识别、指纹识别等领域,人工智能系统已经能够超越人类的识别能力。最为世人所熟知的是围棋系统:采用第一代人工智能技术的程序,2015年达到了业余5段水平。采用深度学习后,围棋程序水平实现了连续增长,从业余走向专业,再从专业迈向击败世界冠军的水平。
深度学习的优点首先是不需要人工提炼领域知识,技术门槛比较低,如图像识别领域,只需把原始图像输入进去即可,不需要告诉系统如何去识别图像,即不需要领域知识。第二个优点是可以处理大数据,如ImageNet的图像库有2万种类别、1400万张图;AlphaGo围棋系统积累了约6000万盘棋局。另外,依靠算法和强大的算力,第二代人工智能取得了令世人瞩目的成就,引发了广泛的关注和全球人工智能产业风潮,在未来还将发挥重要作用。
但第二代人工智能也有很大的局限性。对大规模训练数据的依赖,适用场景狭窄,以及模型自身的可解释性、稳定性和公平性无法保证,限制了其进一步发展。比如尽管第二代人工智能识别图像确实比人类准确一些,但系统的识别方式和人类并不一致,如何识别出来很难解释,以至于人类对其未来应用时遇到新情况的处理能力抱有疑虑;在安全攸关的自动驾驶过程中,遇到新情况的应对也存在不确定性,有风险;还有在图像中加入特定噪声甚至可使系统识别失灵等。
目前普遍的共识是,尽管人工智能经历了60多年的发展,但仅仅是刚刚拉开了序幕,未来的人工智能将比今天的人工智能有更强的能力。为此不少国家已将发展新一代人工智能提升为国家战略,中国也不例外。与欧美等发达国家相比,中国人工智能发展总体上呈现应用技术强、基础理论弱的态势。虽然在人工智能的专利和论文数量上中国已经居于国际前列,在人工智能创新创业方面非常活跃,但在人工智能前沿理论创新方面总体尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。
未来20年,人工智能会发展成什么样子?人工智能技术如何演进?第三代人工智能的特征是什么?这是目前专业人士特别关注的,业界存在多种观点,观点之间还有很多分歧。为此CCF YOCSEF于2020年设立了“第三代人工智能”领域兴趣组(Field Interest Group,FIG),专门研究未来20年内人工智能的演进路径。经过充分准备,该FIG于2020年8月20~21日在北京召开了闭门思辨论坛“第三代人工智能的演进路径”。论坛邀请了张钹院士、黄铁军教授等20多位中国大陆人工智能相关分支领域(如机器学习、逻辑推理、数理统计、复杂系统、技术哲学等)的顶级专家,历时两天,围绕当前人工智能的发展瓶颈、第三代人工智能的发展目标、第三代人工智能的关键方向,以及第三代人工智能关键方向的技术路径等方面内容进行深度探讨和分析。以未来20年促进人工智能在更广泛的领域进行深度应用为现实目标,论坛嘉宾最终在三个关键方向上达成共识,即安全可信智能、领域通用智能和生物启发智能。其中,安全可信智能主要解决人工智能技术“可用”的问题,突破其在医疗、司法、工业生产等高风险领域的应用瓶颈;领域通用智能主要解决人工智能技术“好用”的问题,使其能够以更高效的方式、更低的代价对新场景进行泛化应用;而生物启发智能主要为安全可信和领域通用提供生物学启发和机理性解释,并为形成更高级的智能系统寻求根本性路径。
为了让更多专业人士了解第三代人工智能FIG以及上述思辨论坛成果,CCF在10月22~24日召开的中国计算机大会(CNCC)安排了一个大会论坛和一个技术论坛,大会论坛的主题是“第三代人工智能的演进路径:‘统计’还是‘类脑’?”,技术论坛则是“YOCSEF论坛《第三代人工智能的演进路径》成果发布会”,大会论坛和技术论坛引起了参会者比较广泛的关注。
为了让更多参会者以及未参会的专业人士了解未来人工智能的走向,同时让关注中国计算机事业发展的专业人士了解大会内容,CNCC组委会专门安排录制了特邀报告和论坛的视频,目前已经将所有录制的视频上传到了CNCC网站(cncc.ccf.org.cn)。对第三代人工智能感兴趣的专业人士,可通过网站的大会日程栏目,找到对应的论坛,点击表格右侧的“点击进入”按钮,在页面上找到对应讲者,点击“查看回放”即可观看论坛所有嘉宾的发言。
本文参考了CCF YOCSEF 第三代人工智能FIG项目组整理的各类资料,在此向他们表示感谢。