李德毅院士:智能驾驶——打造中国新名片

来源:中国工业和信息化   作者:李德毅

从人工智能百年发展的角度,分析智能驾驶不断升级的过程。展望未来,到2056年,智能驾驶将成为我国继高铁之后又一张新名片。

我们正迎来新时代,并将见证历史、创造历史。作为一个人工智能领域的工作者,在严寒中需要顽强,在热闹中需要一点冷思考。

从人工智能诞生100年的时间尺度来看,也就是到2056年人工智能诞生100年的时候,人工智能对社会尤其是对交通会产生什么样的影响?这里隐含着一层意思,中国人工智能怎么样占领“无人区”,在世界上做好中国答卷,提出智能时代的中国方案。

什么是人工智能

中国是全球第一个率先宣布要做新一代人工智能的国家。

今天,我们要弄清楚,新一代人工智能的技术特征是什么?传统人工智能应该怎么定义?

其实,人工智能比想象得要难。尽管大家已经尝到好处,但仍要思考它的内核到底是什么?有几个关键词,可以描述当前我国人工智能状态:一是基础研究弱。我国人工智能拿到图灵奖的只有姚期智院士一人,他还是美国培养的。二是辐射市场大。这个比较容易理解。三是叶茂枝不壮,树大根不深,叫好难叫座。真正掏钱投资的时候,就出现了一些困难因素。

1956年人工智能诞生。那么,传统的人工智能是什么?新一代人工智能又是什么?中间分界点在哪里?

笔者认为分界点就是机器碾压人类围棋高手。这发生在2016年。从此,政治家、经济家、企业家、老百姓都觉得这是大事情:中韩一流围棋高手败给了机器人。

从技术上来看,这个成果源于2006年萌发的深度学习,它由20世纪机器学习演变而来。

传统人工智能如何定义呢?笔者提出的概念是计算机智能。这个想法,来自于笔者与李科杰教授的电子邮件交流。当时,谈及国家提出的类脑智能研究方向,这可能是人类最后一个科学堡垒。由此,笔者想到要把人脑怎么工作的机理搞清楚,能不能借鉴脑科学的方法来研究人工智能呢?

现在,人工智能的制高点是预编程人工智能。目前的人工智能实际上是算法功能的智能编程代码,可以在机器上一而再、再而三地执行操作。严格来讲,是机器在执行,智能是算法工程师预设的。

凡是大数据预编程的智能,都可以定义为传统人工智能。

新一代人工智能会自主学习、自编程,不需要算法工程师来编程。

我们需要什么样的人工智能

没有类鸟,人类发明了飞机。反过来用空气动力学解释了鸟的滑翔。滑翔翅膀是不动的,所以飞机翅膀不动。其实,鸟在空中的动作很多地方是科学解释不了的。

没有类脑,人类发明了计算机。反过来用计算智能解释了人脑的部分智能,像围棋计算能力超强。实际上,类脑、类人智能之路还很长很长。站在科学史的发展角度,如果用两百年,甚至三百年能把人脑搞清楚,都是了不起的。

类脑智能从何入手?这里的类脑智能,不是微观上与人脑组织结构一样的生物智能,而是脑科学或者认知科学启发的人工智能。

脑科学涉及生命科学和神经科学,特别是认知神经生物学。认知科学涉及社会科学、行为科学,我国的认知科学还不发达。其实,认知心理学已经有了100多年的历史,特别是讲人是怎么学习的学习科学。所以,要做的是不纠结于细节,不是在微观上去研究类似脑的组织,智能行为上要类人,要剥离意识,不是做人工生命。笔者的主张是,在物理装置上外显人类智能。50多年来,我们团队与天津港一起提出了一个概念叫驾驶脑的物理装置。它没有意识,听话,不闹情绪。脑科学、认知科学启发新一代人工智能的架构,研发的是智能机器。对于交通来说,最大的问题是事故。事故的最大问题是生命。原因就在于人的思想不集中,会疲劳。机器要避免这样的问题,这才是我们真正需要的。

人工智能的研究方向

人工智能70年发展中,有三个主流学科。

一是行为主义。机器人从感知到行为,所有智能都是通过行为表现的。想做什么呢?像人一样行动。要把行为主义智能进一步发扬光大,笔者提出两个智能:感知智能和行为智能。

二是符号主义。研究的方向是什么呢?就是希望机器像人一样思维。笔者在做博士的时候,就做了这个方面的研究,博士论文就是论述问题怎么变成一个未知延伸的证明问题,即证明它的对等性。确切地说,符号主义要研究的是计算怎么样优化,怎么样预测,怎么样可解释。

三是连接主义。它希望机器脑像人一样连接,模拟神经网络的结构,最著名的就是深度学习。机器人行为智能能不能抽象与类比。

笔者认为,人工智能有两个重要领域,一个是计算,一个是记忆。这是新一代人工智能的核心。

举例来说,在一个交通枢纽,大家看到一个盲人,带着一个机器导盲犬在寻找出口。机器导盲犬的摄像头看到一个出口B,但不能确认,在看了C之后,它才确认了B,然后就按照规划走了出去。如果C被标为14,那么它就会确认B不是B,而是13。这个例子说明,B是不确定的,在不同情境下它有不同的含义。离开了情境、离开了语境谈算法和语义的意义并不大。

所以,笔者提出要从4个方面研究语境、语用、语义、语法。计算智能太多靠语境和语法,或者语境和语义。三个学派是各司其职,智智与共。在此基础上,我们开始有我们的思想。计算机诞生于符号处理,类似人的高阶认知,我们被困在计算机太久了,总是在想智能就是计算,期望快一些再快一些。于是,声音、算力、算法、数据被归为人工智能的核心。这么说对不对?对,但不全面,准确的说,它是计算智能的核心,不是新一代人工智能的核心。如果是那样,把技术科学做好就行了,何必把人工智能搞成一个学科呢。人类智能在环境交互中进化,先有感知和行为,自身产生感知智能和行为智能,先低阶后高阶,高阶认知产生记忆智能和计算智能。勇闯“无人区”就是要另辟蹊径,实现更大更快的突破。新一代人工智能,既然叫新一代,必须有一个质的跃升。笔者觉得质的跃升是从计算智能扩展到记忆智能,从人机交互扩展到交互认知,从深度学习扩展到机器自学习,各司其职,智智与共,才是新一代人工智能研究方向。

人类正在进入智能时代,现在是一个未来已来、过去未去的时代。人工智能用动能机器渗透,各式各样的智能代理或者智能机器正在成为人类智能的体外延伸,替代或者服务人类无处不在,无时不在。

新一代人工智能的硬核是什么?

对于这个问题,笔者的回答是会学习。会学习这个词用英文翻译出来就叫Learning to learn。智能植根于教育,文明是智能的生态,为什么把我们生命和思想放在学校里,就是要培养学习能力,是高阶的学习,不仅仅是一种知识。

人在与环境交互中,形成物理空间未知感,通过跨模态感知,一般讲多模态。把物理空间解决的现实问题转化为认知空间,在认知空间不同记忆区留下带时间印记的抽象,可以从长期记忆区直接提取问题解决方案,这叫快搜索,也可以在工作记忆区进行计算思考和推理新的解决方案,这叫慢搜索。通过智能行为作用到物理空间,能感知认知行为环,交互中的空间智能以及现实空间或虚拟空间不停的映射,是人类智能的基本能力。计算机放在这个房间,放在那个房间,不知道在哪里没有问题。可一辆汽车就不行,你知道这辆汽车此时此刻在哪个路口,这叫空间位置感知能力,想象的认知和客观世界。

因为学习,所以与时俱进。我们不再是只具备解决预设同类问题的能力。阿尔法GO围棋能力好不好?很智能,把冠军击败了。但是,假如棋盘不是19×19的,那么,围棋手能下,机器人就不行。如果搞一个矩形,或者六边形棋盘,围棋手仍会下。那么,具不具备通用的智能,体现在能不能随时针对一个跨领域现实问题,生成新的记忆边界完成推理。比如,智能驾驶测试层无论做多少个案例,但发生事故的案例偏偏不在测试库里。所以,智能驾驶比想象得要难。

驾驶文化也不是智能大脑可替代的,这就是无人驾驶的难点,要比人脸识别难得多。

研发有感知、有认知、有行为、可交互、会学习、自成长的新一代人工智能就是我们的目标。希望到2056年,我们的00后能享受这样的东西。

如果说传统人工智能有什么硬核的话,就是算力、数据和算法,新一代人工智能就是交互、记忆和学习。

人工智能产业既是自成产业,更是赋能产业。如果自身没有硬核,就难以形成规模经济。汽车生产企业知道,全世界这么多车,一辆车20万元,20万亿元经济产值,比人脸识别大得多。

智能时代的中国方案

我们对于智能驾驶的长远作用认识不足,对于产业化难度认识不足,对于经济效果希望过高。

未来汽车要做一个机器人路线图。把这个路线图换算到全球坐标,即全球人工智能驾驶——假如从科研探索期,0到1阶段,我们参加那么多次比赛,基本上是在探索,从2020年到2030年,是10年市场创新期,产品孵化期,目前就在这样的关键十年,关键是规模化量产。从2030年到2055年,是人工智能100年。全球现在有多少辆车呢?4.4亿辆,如果到2035年能够把它变成无人驾驶已经是不得了的成绩了。全球现在总共保有10万亿辆车,到2056年全部无人驾驶,比10万亿辆少一点,在这样的情况下应该怎么做呢?这里介绍两条曲线,任何一个新技术都有社会接受度曲线与社会关注度曲线。无人驾驶社会关注度很高,但是量产的前景还在后面。产业化分四个阶段:第一个阶段是炫耀阶段,第二阶段是豪华品牌高端市场阶段,第三阶段是低成本经济型拉动市场阶段,第四阶段是大众普及阶段。第四阶段才是高回报的时段,这也是特斯拉产业化的方针。

中国应该怎么发展呢?

对于我国来说,这十年智能制造乃至人工智能能否占领全球制高点举足轻重。

在2020年到2025年的孵化期前五年,自动驾驶车辆不会是市场主流,可通过有趣的技术,谨慎选择落地场景,先用于特种车或者商用车,先吸引创新者和早期采用者,大家稍微冷静一点,不要太赶潮流。

真正吸引市场的不完全是技术,更重要是痛点和刚需,归根到底是要叫座而不是叫好。可以选择十个场景,它们的共同点是环境恶劣、岗位无趣、白天黑夜重复劳动,人力得不到解放。比如卡车司机、环卫工人。他们中75%的人对自己的工作岗位不满意,95%的人不愿意自己的孩子再干这一行,就应该在这样的场景迭代产品。

所以,我们提出十个场景四大赛道,港口、干线物流,就是当前两个重要方向。乘用车先把自动泊车做好;再一个就是把RoboTaxi做好,把公交做好;还有,就是把农村拖拉机无人驾驶做好等四个赛道。

卡车赛道我们提出了港口运输带动卡车无人驾驶落地。

农机车道把无人拖拉机作为智慧农业的起跑线。

低速电动车赛道率先实现无人配送规模化应用。

2025年到2030年的孵化期后五年,我们希望产业链配套,可规模化扩展,提供精准化管理或市场化服务,产品开始快速迭代升级,十大赛道全面铺开,从示范走向普及,智能网联汽车生产超过1000万辆。这样,大部分城市BRT公交实现自动驾驶,并普遍推广特种车和商用车,迅速向私家车和小轿车普及。

从2030年到2035年是大规模发展期的前五年,智能驾驶车具备学习能力,包括试错学习,如向事故学习,不再是软件定义汽车。它不仅有计算智能,还有交互智能和记忆智能,可以自学习、自成长。

这将是大规模发展的十年,智能制造的辉煌时期,到那个时候智能驾驶车突破地理、气候和人文地理风俗栅栏,车群具有灵活编队模式,形成新的交通文化和社会生态,人工驾驶门槛大幅度提升。

如何打造中国新名片

中国智能网联生态要领先全球,如今国内常见的人工驾驶,到2056年要像今天看到马车一样感到稀罕,可交互、会学习、自成长的轮式机器人机器编队可实现国内交通全覆盖。

希望智能驾驶成为我国继高铁之后又一张新名片,这就是人工智能100年的中国答卷,具体体现在以下几点;

第一,智能车载平台有望提升我国整个智能制造业。因为,只有智能制造才能有规模,有规模才能有万亿元规模级 GDP。

第二,北斗+4G/5G 成为中国智能网联汽车特色生态,这是制度优势和体制优势。

第三,农机智能驾驶成为我国智慧农业起跑线。

第四,公交智能驾驶使老百姓有实实在在的获得感。如果中国所有城市 BRT都是无人驾驶,而且颠簸程度稍微好一点,刹车更柔和一点,制动像小轿车那样灵活,乘坐者就舒服得多。

第五,以港口枢纽和高速干线物流为代表的新一代智能运输系统能够形成。

第六,交互学习和记忆成为新一代人工智能的硬核,辐射所有方面,这就是我的理想和遐想、

(根据李德毅院士在WIC2021第五届世界智能大会的分论坛“智能交通峰会”上的演讲整理,标题为本刊所拟,未经本人审阅)

(0)

相关推荐