新书推荐 | 杨学山论《智能工程》
近日, 由杨学山教授著《智能工程》,已由电子工业出版社出版,此书为“智能三部曲”的第三部。全书共10章分别从构建非生物智能体;感知;描述;连接、记忆和理解;学习与交互等十个角度深入讨论了智能体的方方面面。文章摘自图书前沿部分,供大家学习交流。本文由出版社授权《走向智能论坛》微信发布,文章版权归原作者所有。欢迎转载,请注明原作者姓名以及来源。
新书推荐 | 杨学山论《智能工程》
【内容介绍】
全书共10章分别从构建非生物智能体、感知、描述、连接、记忆和理解、学习与交互、智能体运算模式与处理功能、资源和任务功能系统、生存、思维、控制与主体性、智能体生命周期等角度深入讨论了智能体的方方面面,本书讨论一个极为庞大、复杂,且没有先例、没有形成共识的智能体或机器智能系统的实现机理、过程、要点,没有能、也做不到面面俱到,存在作者有意或无意忽略的环节。本书没有在工程细节层面讨论,只是在整体实现的主要环节的可实现性进行了框架性讨论。
杨学山:《智能工程》
前 言
历经两年,本书终于脱稿。在2015年的写作计划中,并没有这一本书。当时的考虑是,将信息和智能这两种客观存在的属性和发生发展规律说清楚,把超越人类智能的非生物智能体的目标、要求、逻辑架构说清楚,我的研究目标就完成了。因此,2018年年初,我的书桌上已经将写作《论信息》和《智能原理》两本书的参考资料撤掉,换上了经济学相关的资料。过了几个月,收到一些读者对两本书的反馈,感到有必要就非生物智能体如何实现再写一本书。原因在于沿着《论信息》和《智能原理》两本书的认识逻辑和理论框架,去设计这种功能上媲美甚至宽于AGI的非生物智能体,方法上还不采用流行的人工智能领域的模式和算法,可能难以达到,需要将实现思路进行系统的介绍。于是我重新回到已经画了句号的领域,开始《智能工程》的写作,并将三本书合在一起,称为“智能三部曲”。
本书的非生物智能体本质上是机器智能,重点是以生物智能为模板,在既有机器智能的基础上,实现以含义计算为基础,以理解为前提,可以自我积累知识和经验的非生物智能,也就是具有理解、思考、判断、决策行为的思维机器。这种机器能够与人合作,能够集成既有的机器智能,能以持续增长的模式发展。
开始的时候,我低估了写作的难度,以为在理论和逻辑方面已经厘清的问题,只需要具体化就可以了,随着研究和写作的进展,发现这个判断是错误的。难点集中在三个地方:第一,什么样的体系架构能实现《智能原理》中定义的非生物智能体的所有功能和要求;第二,用传统的IT模式形成的软、硬件,如何转变为含义—理解—思维—行为的智能处理模式;第三,可实现性应该在什么颗粒度水平描述。
对于第一个问题,本书第1章中的图1.5是回答的总纲。智能体的架构要支持其所有活动过程:认知、任务、生存和控制。智能体的架构要满足智能体的8个原则要求:主体性、多样性、发展性、生存性、交互性、结构性、传承性、整体性。满足这些要求的一种可能架构由图1.5中给出的11个功能体系组成。它的所有构件,从基础的微处理器到此上各个层面的功能集合,均具备自主、自治的独立性,又处于相应功能集合和整体的有效管理和控制之下。11个功能体系是:感知、描述、连接、记忆、学习、交互、处理、任务、资源、生存和控制。
主体性、生存性这两个要求主要通过四个功能模块实现:资源模块、生存模块、思维模块和控制模块。资源模块联合生存模块保证智能体正常运转,思维模块辨析智能体面临的风险,控制模块决策并主导应急处置。智能体所有构件均被赋予自主、自治的独立性,以避免系统性风险,提高智能体生存性。传承性要求主要通过生命周期的前三个阶段:初始、赋予、培育来体现,并在此后的学习和交互过程中延续。发展性的要求主要通过学习模块实现,学习是发展的主要来源,其他功能模块也会在自身行为中总结成长,或经由学习提升自身功能。交互性的要求主要通过交互功能模块实现,以满足智能体感知、学习、任务、资源和生存各个功能对交互的需求。结构性和整体性这两个既矛盾又统一的要求,主要通过11个功能体系内在的自主结构和相互之间的协同模块,控制功能的整体协调实现。
认知、任务、生存、控制这四个智能过程涵盖了智能体的全部构成要素、功能和行为。每个过程的实现都需要11个功能体系的支持,都在生命周期的全过程发挥作用,全书就是从实现这四个过程的需要去安排11个功能体系的结构、功能、相互关系。本书对这四个过程的功能及其实现有四个特别的安排,这是阅读和使用本书的关键。
第一,认知过程以理解为目的,以智能体可自主发展为中心,以逐步叠加为路径,而智能体所有的功能,包括认知的发展,均基于认知。“知之为知之,不知为不知,是知也”这句2500年前孔子的名言是本书的哲学基础。“不积跬步,何以至千里”是本书实践路径所遵循的原则。以互联网为平台,以交互功能为媒介,一个字接着一个字、一个动作接着一个动作、一个场景接着一个场景,一个主题接着一个主题,将人类智能的进展用愚公移山的精神,大规模自主并行,叠加到智能体的记忆中,形成远远超越一个自然人可理解、可使用的记忆,并在交互和使用中校验、完善。与认知相关的功能体系设计就是按照这样的原则执行的。
第二,任务过程是以认知的积累为基础的,也就是只承担能够做的任务,力所不逮的不承担。智能体认知过程的核心就是先积累常识和基础知识,待达到一定程度后,在拟承担的任务类型方向不断深化,达到专精的程度。所谓专精,就是对所有需要求解的问题在实际工作场景的所有可能形式都已经遍历,所有这些形式的求解过程也已经遍历,而且形成的所有求解过程都是确定的,或即使存在一定的不确定性,也不影响结果可靠性要求。换言之,围绕任务的认知就是力争穷尽一个个特定任务的问题空间和解空间,任务执行只承担可以判断解的路径是确定的问题。有些人可能认为,穷尽特定问题的问题空间和解空间是一个不可能实现的命题,从抽象的角度,或者从纯逻辑的角度,可以得出这样的结论,但从实际经济社会的工作岗位看,随着发展,绝大部分工作岗位的任务,其问题空间和解空间是可以穷尽的。一个生产线上的工人,一个销售员、一个理财师、管理者,在实际工作中处理的的问题类型及其变形都是有限的。对于智能体来说,从可穷尽的开始,在其庞大、不知疲倦、快速度迭代、相互独立又可以协同的认知功能支持下,可穷尽空间的问题类型会越来越多,在一定的发展阶段,就会超越普通的员工,并能继续发展,超越一群人,直至超越大部分人,直到具有所有人都达不到的新特征或新高度。
第三,生存过程是当智能体成为社会独立主体时,能承担社会责任,能不间断、自主地积累知识、经验、技能、事实、数据,所必需的是在生命周期的某个时间点开始能将生存能力掌控在自己手里。
第四,控制过程更是智能体所有过程能够形成、发展、发挥作用的关键。智能体是由数以千亿到万亿量级的自治构件组成的,这些不同类型、功能、层级的自治构件都有各自和相互之间的控制和协调功能,这是控制过程的基础和重要的组成部分。智能体的控制更重要的是整体的控制,这是控制功能系统的职责。控制功能有两个重要模块:一是意识和思维,对智能体的运行和环境不间断地观察,分析判断是否存在风险,是否存在被局部忽略,控制功能体系处置的事项;二是智能体全局的决策、控制、调度和处置。
对于另一个难点,本书以六个功能系统中的相关功能和规则,解释为什么可以将传统的IT模式组成的软、硬件,转变为含义—理解—思维—决策—控制的智能处理模式。
其实,传统的数据库管理系统、数据分析系统、商业智能系统,都能通过严格的数据控制、数据格式、数据字典和确定的处理函数,从数字(符号)得出预期的、具有含义的结论,也可以根据数据结构、函数和数据字典给出解释。这就是从符号中得出了含义的结果,也可以说在这个范畴内,系统可以给出数据库中的特定字段、处理结果的“理解”,因为它可以解释。缺点在于,不能泛化、跨系统积累,只在该系统能达到的范畴和深度。这个例子也给我们一个重要的启示,刚性的符合数字内在含义的结构和处理、解释规则是可以从符号中导出含义的。尽管另一些处理模式也可以得出符合所处理符号隐含的含义,但如果不可解释,就不能认为是智能的,智能的基本条件是能解释。
基于这样的分析,我们能将得到的信息以一种结构化的、可解释的方式转换为感知到的对象(符号),然后以智能体统一的、可理解的符号和标识体系对这些符号进行转换,并保持由传感器决定的感知内容及感知对象的全部结构,以及静态的各种空间关系;动态的则加上时间序列的所有细化对象的空间关系,再与已有的以前感知的同类对象、以前描述的同类符号转换,用连接表述本次感知的全部关系,把感知对象的基本单元与已有的记忆比较,将所有的关系显性表述。经由这样的模式保存起来的感知对象,就转换成了智能体可理解、可利用的记忆。这里有三个关键环节——感知、连接和记忆。感知把关是基础,所有的外部对象(文档、图形、音/视频)必须经由唯一的感知器感知,一个感知器感知的结果可以由描述功能以智能体可理解的符号表示。实现这个要求的方法就是感知器的单一性,如一个汉字就是一个传感器;一种声纹特征就是一个传感器,声音是片段声纹的时间序列;图像则以一个个基本形状特征及色彩组合为传感器,视频是图像系列。数以十亿、百亿的逻辑感知微处理器和数量较少的协同的物理感知微处理器与其识别对象的描述处理器直连,将对象中的要素及其连接描述完成后传送到记忆,在记忆与其他可能的相关连接成为智能体所有功能模块可理解、可利用的记忆单元。任务过程在一定意义上是认知过程的逆过程,任务被感知后,进入规定的任务类区域,在该任务类匹配到适用的执行微处理器,通过执行微处理器调用物质资源、记忆单元和确定的处理微处理器,完成任务的执行。生存和控制过程也以类似的模式完成。所有的智能体功能过程或智能行为以感知为起点,用特殊的结构实现了从符号到含义、从存储到记忆、从计算到理解的转换。
最后一个难点本质上是技术性问题、工作量问题。颗粒度越细,工作量越大,对理论到实践的前瞻性要求越高。本书在写作的初期计划用28章的大篇幅,在类似于概念设计的颗粒度层次上完成,后来发现工作量太大,也没有必要,因为本书的任务不是以具体项目的方式去考虑,而是对可实现性的一种解释,所以尽可能将颗粒度放大,能看到可实现就达到了本书的目的。最粗略的估计,一个通用的非生物智能体是一个大体需要千亿美元或万亿元人民币量级的资金,用6~8年时间,高峰时需要数千人的开发团队及大量基于互联网的志愿者参与的工程。它没有先例,细粒度的讨论缺乏基础。所以,本书没有描述细节,去掉了原计划中对主要功能实现例子的逻辑过程描述。既有篇幅与前两本书一致性的考虑,也有不约束实现模式和细节多样性想象的考虑。
有人说,这个系统太过庞大、复杂,热力学第二定律必然使其窒息;有人说这样的系统必然存在计算复杂性,并因此而崩溃。实际上这是在不同维度上的思考。智能体的所有过程都是含义处理,含义处理的基础是理解,在理解上叠加,是1+1+…直至一个个逻辑对象、物理实体、功能单元、信息记录走向完备,直至一个个由上述对象构成的不同层次的集合走向完备,直至由上述一个个集合构成的系统走向完备。在这里,有M级(百万)、G级甚至T级的1+1可以轻松实现,然后持续地+1,从而实现可以理解,实现可以执行外部任务,实现逐步地超越一个自然人的能力、若干个自然人的能力、成千上万个自然人的能力,在一定的时候,超越所有人的能力。
非生物智能体设计成所有构件都具有自主、独立运行的模式,既符合智能的特征,又可以降低系统的复杂性。数量巨大、可以独立运转又必须服从整体协调的微处理器和智能单元,构成了一个个功能过程和智能行为,从而实现智能体的所有功能。
本书共10章
第1章,构建非生物智能体。其担负着上承《论信息》和《智能原理》两本书的主要结论,下启《智能工程》的逻辑、架构和思路的任务,是全书的总纲。该章首先在《智能原理》的基础上,进一步明确非生物智能体是什么、为什么,总结对智能体的基本要求;在这个基础上,提出了本书对满足这些要求的体系架构和重要环节的实现思路。这里需要读者注意的是,1.1节~1.5节沿着《论信息》和《智能原理》的逻辑和概念体系讨论对非生物智能体的要求和展示,而1.6节和1.7节则基于本书的逻辑和概念体系,其中存在概念不一致的地方,主要体现在对底层构件的区分,在前面几节中的信息、功能、处理的逻辑最小单元在1.7节及以后的章节中则合并为一个微处理器,因为从工程的角度而言,它是合在一起的最小构件。
第2章,感知。这是从传统的符号处理到含义处理,是从图灵计算模式向智能计算模式转变过程中基础、核心、关键的环节,所以是全书篇幅最长、颗粒度最细的一章。本章从智能体感知的功能开始,介绍了以感知微处理器和规则体系为基础的感知功能体系,并分别讨论了不同类型感知对象的实现方式及后续的处理。感知功能有三个特殊的设计:一是一个物理或逻辑感知微处理器只识别一个特定的对象,而且不仅最小的可识别对象由一个特定的感知微处理器感知,依据智能体记忆单元确定的组合对象也由专门的感知微处理器感知;二是一个感知微处理器是该智能体关于这个感知对象的百科全书,可以连接到所有与此相关的内容,实现完整的前馈处理,任何新的对象进入,都可以全关系融入已有的记忆中;三是将一个对象的感知、描述和记忆经由连接或直接成为功能区分的一个逻辑微处理器。
第3章,描述。感知实现了符号转换成含义的关键第一步,描述则是建立统一的,智能体可理解、可使用记忆的功能体系。所有进入记忆的信息,无论是什么形式,源自哪个功能过程,必须经由描述微处理器处理,这保证了智能体所有保存信息、含义特征的统一。本章规定了描述的定义、功能和实现的机理。描述基于统一的符号体系和表述规则,描述微处理器对描述对象的“理解”基于来源的唯一性,一个描述微处理器只承担一个感知微处理器或其他功能体系需要描述的一个微处理器传送过来的描述对象。一对一的机制,保证了描述的正确性,这个正确性加上连接的穷尽特征,就从刚性的转换变成了真正的理解。
第4章,连接、记忆和理解。在感知和描述的基础上,本章介绍连接和记忆两个功能,为智能体以理解为基础的含义处理、认知过程画上了句号。连接是智能体贯穿一切构件、功能、行为的基础功能:构件由它表示相互之间的所有关系,功能通过连接表述并调用,行为过程也是一个连接的过程。如同大脑一样,每个神经元平均拥有1000个神经突触,实现神经元之间的连接,并通过连接形成的结构表述信息,实现功能。智能体的一个描述性记忆单元,同样拥有大量的连接,很多智能体的连接数会超过千量级,最多的可能达到百万量级。记忆既是感知、描述、连接产生的结果,也是智能体学习和成长的基础。不同类型的记忆,通过给定并发展的规则,不倦地追求完备,成为学习的触发器。理解是认知过程的结果,本章解释了理解这个人类智能的核心秘密智能体是如何实现的。
第5章,学习与交互。对于智能体,学习是整个生命周期永不停息的基本行为。学习的触发源自各功能系统的需求,需求来自两个主要的方向。一是各自追求自身完备的内在动力,保持这个动力的规则在初始、赋予时植入,在培育时激发,只要没有达到完备,就会触发学习过程。二是如果智能任务在执行时发生不能保证在结果可靠性要求的范围内完成,则触发学习。即使停止了任务执行,但相应的学习不停止,直至可达到的问题空间和解空间完备。交互包含了智能体所有与外界的连接,包括物理性连接和逻辑性连接。物理性连接,保证了智能体与外界必要的接触;逻辑性连接则保证了智能体与外界的交互能够以与交互对象熟悉的方式及规则进行。本章解释了学习与交互怎么进行、如何实现。
第6章,智能体运算模式与处理功能。处理功能体系完成智能体所有的逻辑性,也可以说是信息性的处理需求。本章有三个主要内容:一是介绍了智能体的运算模式及处理功能体系的构成;二是分析了软件如何从初始、赋予、培育阶段的学习到成长开始逐步转换为自身的运行、维护、发展能力;三是讲述了智能体需要的主要运算类型和运算函数,介绍了这些函数的计算方法,展示了其与传统计算的区别。
第7章,资源和任务功能体系。在11个功能体系中,资源功能体系构成是最简单的,但它是智能体生存、发展的必要条件。本章介绍了主要的资源类型及智能体如何获取,如何从人类专家手中接管,并在此后的发展中逐步实现自主管理、维护,甚至开发部分资源的条件、模式。本章的任务是指在《智能原理》一书所归纳的各类智能任务中专门将一类外部交予智能体执行的任务。任务是智能体存在的目的和依据,所有的过程和阶段都围绕任务执行这个中心。本章介绍了任务功能体系的构成,以及任务的类型和执行的一般过程,阐述了一些主要的问题执行方法。其中,最主要的原则是智能体只执行能完成的任务,所谓能完成,就是外部提交的任务,智能体已经有成功执行的经验,即执行留存微处理器,启动该微处理器,这个新提交的任务就可以完成;或者是没有执行过的新任务,但在培育或学习过程中已经有类似任务模拟执行的留存微处理器,即使新接受的任务与模拟执行有所不同,但这些不同可以通过确定性程度高的逻辑过程解决,因此,结果的确定性也能达到客户的要求。
第8章,生存、思维、控制与主体性。本章涵盖智能体两个功能体系,集中阐述主体性这个智能三要素中核心要素的构成和实现。《智能原理》对智能系统与智能体的区别做了系统的分析,具备主体性是智能体存在的必要条件,没有主体性,不管采用什么算法、具有多强算力,都是智能主体的工具。主体性的主要功能是自我保护的意识和行为、成长发展的主导性、社会主体的独立性。本章从生存、意识和思维、控制三个方面介绍了主体性的构成和实现。生存系统能够保证智能体正常运行所需的所有资源、所有的功能运转正常。另外,这个保障功能,要逐步从人类专家手中转移到智能体以生存功能体系主导的相关功能中。智能体的意识和思维不同于人,它不是情感和欲望,而是建立一种机制,以对智能体各个部分的故障、潜在风险、全局决策问题进行分析,能够及时发现并由控制功能决策与处置。智能体的控制由各个自治、独立的功能构件和全局的控制功能构成,分布的控制功能受全局控制的协调。
第9章,智能体生命周期。本章介绍了智能体从初始到终止的六个阶段。初始是设计开发,赋予是成形,培育是功能的实现,成长是以学习为主体的能力增长,任务是开始履行社会职责,复制与终止是智能体的遗传和终结。智能体生命周期的特点是其主导主体从前期的研发团队到后期智能体自身的渐进移交过程,再次凸显了智能体发展环境的重要性。
第10章,尾声:拉开创建超越人类智能的非生物智能体序幕。总结《论信息》《智能原理》《智能工程》三本书的主要发现,重申信息与智能不适用物理规律和大部分数学工具,创建超越人类智能的非生物智能体是人类的历史责任,是人类和地球文明获得延续的必然要求。物理和数学及其背后的认识论架构取得的巨大成绩,以及几乎成为研究信息、智能和人工智能领域科学工作者共识的思维范式,导致人们对信息、智能和智能体构建工程这三个具有独立性的不遵循物质运动规律、不适用主要数学工具的领域,不能建立基础理论,不能取得突破性的进展。需要转变对这些具有新的发生发展规律的事物的认知定式,这是当前最根本的任务。
本书写作接近尾声的时候,我的小孙儿8个月。我看他在地上爬,刚开始向前爬的时候,越使劲越往后,离他想到达的目的地越远,可是没几天,他就能顺畅地向目的地方向爬,双手、双脚、肚子、头部的协调甚至可以说完美。这个过程中,没人教,就是教,也不可能听懂,没有可以模仿的对象,没有其他人或动物给他示范。这个例子,使我更加坚定地认为,智能的遗传性,以及初始、赋予的必要性;成熟的智能是肌肉智能、小脑智能,大脑智能是学习、试错、尚不成熟的智能;智能体的智能发展就是要通过学习,将大脑智能转变为小脑或肌肉智能之后,才用于执行智能任务。
本书讨论了一个极为庞大、复杂,且没有先例、没有形成共识的智能体或机器智能系统的实现机理、过程、要点。本书没有在工程细节层面讨论,仅对整体实现的主要环节的可实现性进行了框架性讨论。
《论信息》《智能原理》讨论的是信息和智能的自然属性,在“智能三部曲”完成之后,我将继续研究信息和智能的社会和经济属性,为分析揭示社会经济活动加入信息这种特殊的资源、智能这种独特的技术之后的经济学理论铺砖。本书是在《论信息》中关于信息结构和显性完备信息结构等内容,以及《智能原理》中关于智能要素、智能逻辑、智能计算架构和非生物智能体的形成和发展的基础上讨论和介绍的,没有将这两本书中有关的内容重复介绍,所以请读者将相关内容联系起来,更易理解和把握。
坦率地说,本书封笔的时候,我感到还是有很多缺陷。客观的原因是,在没有实践证明的前提下,讲述工程实现存在很多困难。当然,即使是工程,总是有第一次,只有在探索的过程中才能发现问题、纠正错误。基于这样的心态,我结束了此书的修改,交付出版社,希望能成为引玉之砖。
感谢储荷婷教授在新冠肺炎疫情期间为本书翻译了前言和目录。
感谢电子工业出版社总编辑刘九如及其他工作人员在本书出版过程中付出的心血和劳动,没有他们的努力,本书不可能这么快以如此精美的形式呈现在各位读者面前。
【作者介绍】
杨学山
1984-2001, 国家信息化中心;
2001-2008,国务院信息办;
2008-2015,工业和信息化部副部长。
研究领域:汉字信息处理,信息系统和网络的设计和开发,信息经济学,信息法学,国家信息化发展战略,人工智能理论等。1981年以来,先后发表了150余篇论文,著有《专家系统及其在管理中的应用》,《知识经济时代的企业技术创新和改造》、《企业信息化建设与管理》、《论信息》《智能原理》等著作。