机器人的寒武纪大爆炸会到来吗?

来源:Pratt G A. Is a Cambrian explosion coming for robotics?[J]. The Journal of Economic Perspectives, 2015, 29(3): 51-60.

王伟 译

北京航空航天大学,机械工程及自动化学院,学院路37号,100191,北京

1、前言

大约5亿年前,地球上的生命经历了一个短暂的快速多样化的时代,我们称之为“寒武纪大爆炸”。针对寒武纪大爆炸的起因,学者们提出了很多理论,其中最煽动人心的说法是视觉的进化,使得动物能够快速提高找到配偶的能力(Parker 2003)。当前,某些方面的前沿技术的发展正在促成一个类似的大爆炸,机器人的多样化和适用性的大爆炸。许多机器人所依赖的底层硬件技术--特别是计算、数据存储和通信,正在以指数曲线快速增长。在爆炸式增长周期中,两项最新的技术--云机器人和深度学习,能够最大限度地利用这些底层技术。云机器人由James Kuffner于2010年提出,每个机器人都可以学习所有机器人的经验,从而导致机器人能力快速增加,特别是当机器人的数量增大的时候。深度学习算法是机器人学习和概括其他机器人的方法。深度学习基于非常大的(通常是基于云的)“训练集”,往往包括几百万个学习实例。有意思的是,Li(2014)指出,通过这些技术组合所得到的最新的机器人性能就是视觉。跟寒武纪大爆炸一样,视觉扮演了最重要的角色。

机器人的寒武纪大爆炸多久会到来?具体答案不好说。有人可能会说到计算机象棋的发展历史,蛮力搜索和启发式算法可以击败最好的人类棋手,但是,没有任何下象棋的程序懂得如何处理极其简单的类似问题,比如,如何在井字棋这样直截了当的游戏中获胜(Brooks 2015)。这种观点认为,专用机器人可能会在某些预先定义好的任务中表现优异,但是在真实世界中,待解决的问题远远多于目前已知的解决问题的方法。

计算机象棋程序需要先定义象棋规则,今天的深度学习算法则不同,它使用广义的学习技巧,与所在领域没有多大关系。这些算法应用于解决许多知觉问题,比如语音识别和视觉等。我们有理由相信机器人会在不远的将来解决联想记忆问题。那些使用了深度学习算法和高维输入的机器人能够达到跟人类同样的水平。更进一步地,计算机象棋水平按照线性或者预期的速度提升,但是深度学习提升的速度是惊人的,甚至达到了某些领域的专家水平。一方面,大量可使用的训练数据和计算资源将此变为可能;另一方面,正在使用的算法已经存在了一段时间,随着学习性能的提升,学习过程实际上变得更加简单了。

深度学习通常使用所谓的“神经网络”,在某些方面与我们已知的大脑结构是不同的。跟之前的人工智能技术(比如计算机象棋所使用的搜索方法)相比,深度学习的“联结”方式与神经系统更加类似。真实大脑的某些特征已经实现了,比如情景记忆和“无监督学习”(不需要任何指令就能把相似的经验聚集起来),但是深度学习似乎马上就能把许多大脑的知觉功能复现出来。尽管能否把相似的方法移植到认知功能上还存在一些问题,但是从解剖学上看,大脑的认知部件和感知部件的结构是相似的。因此,有理由相信在某一天,通过深度学习可能将人工认知实现,前者依靠短期记忆系统和执行无监督学习的新方法得到加强。迄今为止,我们还没有那么多的认知数据集,不像我们已经拥有很多有利于计算机感知的图片和语音数据集。但是,某些用于收集这种数据集的方法是可能的,这个问题将会在后面讨论。

引爆时间很难预测,机器人性能大爆炸的准确时间也难以精确给出来。在自治系统和机器人领域的商业投资显著加速,特别是无人驾驶汽车,国际巨头Amazon、Apple、Google和Uber等,也包括所有的汽车制造商,均宣布在该领域会有大手笔项目投入。在本文接下来的两章中,我将分析对现有机器人领域有贡献的关键技术。跟其他技术发展一样,机器人和人工智能技术所带来的社会影响令我们充满了忧虑。因而,我将会提出有关机器人如何影响经济的想法,并给出解决潜在难题的方法。

2、八大技术驱动力

跟机器人开发相关的几项技术都在以指数曲线的速度发展。在此,我将讨论最重要的八项技术。前四项技术开发与单个机器人有关;第五项与连通有关;最后三项与英特网性能有关,这将会勾勒出云机器人的未来。

1)计算性能指数增长。机器人包含计算机,后者协调传感器和驱动器,而且计算机的处理能力持续增长。摩尔定律,最早由Gordon Moore(1965,1975)提出,他是Intel的创始人之一。该定律指出,集成电路上晶体管的数量大概每18-24个月会翻倍,处理速度也按照相似的速度发展。这种关系在过去的好几十年都是成立的,然而现在它似乎遇到了一些根本的限制。半导体公司在芯片上蚀刻晶体管,尺寸量级为14纳米(举个例子,http://www. intel.com/content/www/us/en/silicon-innovations/intel-14nm-technology.html)。1纳米小得难以想象,它是1米的十亿分之一:一张纸大概是10万个纳米厚。这么小的尺度已经接近物理极限了,因为它需要在原子级别上加工。然而,至少在接下来的几年,摩尔定律在技术上还是成立的(Bauer, Veira, and Weig 2013),比如二维集成电路不够用了,就采用三维或多芯片系统。

2)机电设计工具和数字控制制造技术进步。现代计算机辅助设计工具能够显著提高机电设计师的工作效率,包括设计质量和设计经验。数字控制制造工具--包括新的增材制造,比如3D打印--能够把设计高精度的制造出来,即使复杂性增加,成本也不会增加多少。嵌入式处理器允许控制更加复杂,且性能和可靠性得到提升,所有这些都会提高机器人的性能和可靠性。

3)电能存储取得进步。如果是移动机器人,必须要解决存储或生成能量的问题,至少能够在两次充电间隔期间让机器人维持运行。在过去的几十年,电池和燃料电池发展缓慢,没有达到预期。标准锂离子电池跟碳氢燃料(包括汽油、糖和脂肪)相比,其容量要低一个数量级,但是,差距正在逐步缩小。笔记本、平板电脑和手机等便携电子产品市场,需求大且竞争激烈,还有混合能源和电动汽车市场,这都持续激励人们创新,并在能量存储方面取得进步。超级电容,一种新技术,充放电比标准电池快得多,可以充放电几百次甚至几千次,但是在存储能量的容量方面还需要取得显著的突破(有关锂离子电池和超级电容优缺点的讨论,可以参考Miret 2013)。对于那些已经能够接入充电设备的机器人应用,电池能量存储已经足够了,且能量存储会随着时间继续进步。

4)电子器件能量效率提升。依靠电池运行的机器人使用电子器件管理电机能量,尤其是具有较多电机的机器人会对这些电子器件的成本和性能非常敏感。功率半导体利用了集成电路工业的总体技术进步,它们变得更加便宜。这是由于便携设备的持续发展,且便携式设备都对电池的效率非常敏感。LED照明技术是另外一个快速增长的市场,功率半导体器件使得产生光的效率更高,所需的功率更低。新型的化合物半导体(氮化镓和碳化硅)可能给消费者带来更高的性能和更低的价格。将云机器人和深度学习融合在一起的计算需求现在由图像处理单元提供,最初为视频游戏开发的特高性能计算机芯片。在将来,计算可能由神经形态(脑启发的)硬件提供,通常会消耗更少的能量。

5)局域无线数字通信的可用性和性能指数增长。早期的机器人是单独的一台机器。它们记住和解决问题的能力受到自身所安装的程序的限制。升级它们的信息或者重新编程是费时费力的事情。然而,具备灵活网络连接的机器人会给编程、解决问题、学习和升级提供多种可能性。高性能的无线数字通信变得更加普及,各种各样的平板电脑和其他产品将无线通信技术的好处发挥到极值。例如,由Nest生产的“学习温控器”不仅能够通过手机调节,还可以记住和学习你什么时候把温度调高了或调低了,将来就会自动调节温度了。Google公司的Chromecast设备能够让你把计算机或移动设备上的内容通过无线连接显示到电视上。2014年世界平均WIFI速度为10M/s,这个速度在2018年会翻倍。2014年全球有4800万公用WIFI热点,到2018年这个数字预计将会增加7倍(Cisco 2015)。最新WIFI标准(802.11ac)的速度超过1G/s,最新的蜂窝数据速度将会达到5G/s。伴随这些变化,机器人将会更加快捷地与周围的设备无线通信。

6)因特网的规模和性能指数增长。设备之间的无线通信突飞猛进,设备以外的因特网通信速度也在飞速发展。当前全球因特网的每月流量预计为88安佰特(10^18字节),在未来三年这个数值会翻倍,短期内不会饱和。目前有130亿个设备连接到因特网上,平均每人两个设备;在2019年将会到达平均每人三个设备连接到因特网上。

7)全世界数据存储指数增加。全世界存储的总数据的量级在10^21次方字节,随着娱乐和社交媒体的爆炸性需求,这个数值还将继续增长。相比较而言,人类大脑的突触数量在10^14量级。如果我们粗略地把一个突触比作一个存储的字节,那么全世界现在的存储量将相当于1000万个大脑。当然,磁盘上的字节由计算机串行读取,不像人类大脑突触那样紧密的连接起来。所以,如此巨大的信息存储量还不能组合起来模拟一个大脑,更别说1000万个了。但是信息的总量很大。

8)全球计算能力指数增加。全世界总的计算性能已经达到10^21个指令/秒这一量级。更重要的是,几十亿个磁盘驱动器已经生产出来(也许只有大概10亿个在使用),若干大型因特网公司并行运行数以百万计的高性能服务器,每个都带有高性能多核处理器。因此,任何计算都可能被划分成并行操作,被快速瓜分和解决,因为解决单独某个问题不需要中间结果的通信。(问题可能会被分成若干部分,每部分都并行解决,有时候称之为“尴尬的并行”问题。)机器人自治的很多问题都可以用这个方法来解决。

3、云机器人

这些技术发展告诉我们,机器人自身的性能正在快速提升,机器人相互连通的性能也在快速提升。一些伟大的想法,通常称之为“云机器人”的想法被提出来,最大限度地使用这些技术,使得机器人的性能得到提升。云机器人潜在的好处可以归纳为四个大创意。

3.1 大创意1:基于记忆的自治

在计算和存储性能方面的突飞猛进引导研究者们开发基于记忆的方法,来解决感知、规划和控制问题,这些问题的解决能够为机器人更大的自治带来发展。不是把这些任务分解成一系列手工编码的、专门针对特定环境的算法,而是搜索大量之前的经验记忆,基于与之前经验匹配的程度给出机器人的响应。如果没有之前的经验与之匹配,那么就可以在相类似的经验之间插值,或者寻求人类帮助。将人类提供的答案记录下来,供该机器人和其他机器人将来使用。

因特网信息的快速搜索算法取得了飞速进步,进一步提高了基于记忆的方法的可行性。使用基于云的计算,在查找已有实例的时候可能会发现很多外部计算资源,且只花费了非常少的通信量。但是,要想实现基于记忆的方法,解决方案的记忆从哪里来呢?

3.2 大创意2:高速分享经验

单个机器人,如果采用基于记忆的方法来提高其自治能力,就好比一个刚出生的婴儿,极有可能需要好几十年才能学会某些技能。实际上,机器人可能比小孩子还要反应迟钝,这是因为机器人不具备直觉。

尽管人类大脑内部的通信带宽比机器人高得多,但是人类同外部其他人通信的速度却很低,差不多在10bit/秒这个量级上。机器人和计算机的通信速度一般都超过1GB/s,差不多比人类快一亿倍。基于外部通信速度差距玄虚,利用无线通信和因特网技术就可能将某个机器人学到的知识与其他机器人分享。人类需要一二十年学习才能把常识概括出来。然而,机器人不仅可以互相学习,而且可以从一出生就开始概括机器人知识。

将来的机器人可能带有高性能的“大脑”,从云端缓存记忆,只有在不确定该怎么做的时候才使用因特网。还存在另外一种可能,高速因特网通信意味着绝大部分的机器人智能都是通过云端的计算资源来实现的(就跟现在的一些视频游戏一样)。具体会是哪一种,目前还无法确定。无论哪一种情况发生,高速通信和因特网都会像催化剂一样,快速提升机器人的性能。

3.3 大创意3:从想象中学习

人类通常采用想象来为将来发生的事情做准备。与之相似,机器人--或者说是带云计算大脑的机器人--可以利用仿真,探索将来机器人会遇到的事情,并实验各种可能的解决方案,最终记住那些有效的解决方案。这些仿真不需要真实的物理活动就可以完成,而且每个机器人的想象都会提高其他所有机器人的性能。

3.4 大创意4:向人类学习

知觉依然是机器人自治里最有挑战的内容之一。近年来,利用大量数据集去催化知觉被证明是非常强大的。大数据集也可能会对机器人的规划和控制产生重要支持。

录制目标物和人类活动的视频,并把这些视频作为在线知识库,可以为机器人提供非常多的资源,供它们提升理解和接触真实世界的能力,包括与人类交互。社交媒体在2013和2014年共上传的照片超过10^12张(Meeker 2014,slide 62),如果按照这个增长速度,2015年上传的照片将会新增10^12张。现在,每分钟就有300小时的视频传到Youtube网站上,视频内容主要是展示人与人和人与环境如何交互(见https://www.youtube.com/yt/press/statistics.htm)。当3D传感器普及后,这些数据资源还将会极大丰富。

虽然绝大部分因特网上的视频信息是没有标识的,但是集群技术能够用来辨识图片和视频中相似的组件--例如,我们把相似的脸部分组--这样的话,当某个视频实例的意思被机器人学会(也许是通过人工做标识告诉机器人的),这些信息就可以用于理解其他图片和视频。对这些资源的利用速度呈指数增长。

4、对经济和劳动力的影响

虽然机器人寒武纪大爆炸肯定会极大地改善人们的生活条件,但是它也可能是一个颠覆性的经济力量,部分原因是我们经常讨论和担心的机器人会让某些岗位变得没有必要。尽管存在这些担忧,我们还是应该持积极态度来迎接即将到来机器人变革。拿鲁滨逊漂流记作为一个经济学例子来讲--一个困在荒岛上的人是不会需要钱的。如果这个人使用一个或一群机器人来促进生产,他会获利吗?答案显然的。最根本的经济学观点是,机器人创造财富,但是传统的通过人工劳动方式来分配这些财富就会变得有问题了。在这里,我能给出一个非经济学家的观点和想法,讨论机器人对不断进化的劳动力所产生的潜在影响。我也会讨论通过人力分配财富的其他方法。这些方法包括人性化服务、通过资本分配和其他一些新方式--信息经济中的个人偏好。

4.1 生产、需求饱和和人类适应

传统意义下的技术和劳动市场的相互作用遵循一定的模式。技术会提高某个领域的生产能力。尽管该领域的产品需求会变得基本饱和,但是人们不会对欲望满足,很快就会发现其他新的需求。虽然部分劳动力会随着技术的扩展而配置,但是劳动力市场的供需关系会带来一系列转变,以便于劳动力流向新需求所在的领域,这样的话,失业率并不会随着时间持续增加。相反的是,平均工资却上涨了,因为技术提升了劳动者的生产能力。举个例子,虽然纺织行业的工业革命创造了许多严酷的工作环境,但是纺织品产量上升和价格下降,使得消费者(通常就是纺织工人自己)能够买得起那些在以前是超出他们经济承受范围的纺织品。那些购买纺织品节省的钱就被用于购买其他产品,包括一些新产品。之后,纺织行业的工作条件改善,劳动力多样化。

尽管每隔几十年人们都会喊狼来了,自动化会导致失业,但是这个普遍模式在过去的两个世纪中在不同的经济门类中都反复得到了验证。然而,这次的情况可能不同。当机器人性能快速提升的时候,跟之前的几次技术浪潮相比,机器人可能会在更短时间内调配更多数量的劳动力。更高级的机器人性能可能会降低许多行业的劳动价值。人类作为劳动技能的提供者,往往提升较慢,即使是在受过高等教育的社会里。换句话说,机器人性能提升的速度如此之快以至于许多工人会发现自己已经没有什么可以拿出去销售了。

长期来看,人类对产品和服务的需求量和多样性是不会饱和,因而,经济发展对劳动力的需求量并没有减少。但是,当机器人的性能超过普通人类的劳动能力的时候,这个模式还会继续成立吗?我们可以想象在将来,大部分人所需要的许多物质会由先进机器人以非常低的成本生产出来。这种经济会以多种方式发展。但是一个可能的结果就是机器人对许多经济部门的影响就如同今天因特网对音乐行业的影响一样--也就是会产生这么一种经济形式,少数极具天赋的超级巨星收入很高,而其他大部分人只能获得很低的报酬。在本章接下来的内容中,我会提出几种解决此问题的可能的方法。

4.2 人性化服务

当前,即使机械制造出来的产品比手工制造的产品有多种多样的优势,通常手工制造的产品价格也要高,这是因为使用了稀缺商品--手艺人的时间。这样的例子还有很多。即使音乐唱片行业崩溃了,现场音乐会依然会有很好的市场。尽管唱片录制的质量和效果总是比音乐会好,而且音乐会通常都在嘈杂的环境中,跟录制唱片的环境没法比,但是两者还是有差异的。跟一个人在家里听唱片或者收音机相比,同一群人去参加现场音乐会的感觉更带劲儿。没有谁会穿一件演唱会的体恤衫,听的却是录音。

因而,某些人性化的服务总可能比机器人提供的服务要价更高。这就产生了一个问题:将来机器人制造的替代产品非常便宜的时候,未来的经济是不是主要基于个性化和手工产品了呢?虽然现场音乐会很受欢迎,但是人们所听到的绝大部分音乐还是录制的。

4.3 机器人资本所有权的分配

我们来想象一下,在某个假想的经济体制下,每个人都拥有一个机器人,并让机器人替自己去干活。在这样的世界里,经济将会顺利发展,我们将会有更多休闲娱乐的时间,而是由我们的机器人替身来养活我们。当然,最初如何分配、交易和为避免机器人资本破产提供保障等,这些事项都必须要制定好。但是,现有的交易资本体系会给将来的机器人资本分配提供一些基础。在现有的分配体系下,投资人的智慧(也包括运气)决定了谁分得多点儿谁分得少点儿。James Albus,一名工程师,前美国国家标准和技术研究所制造工程实验室的智能系统部门的负责人,在1976年出版的《Peoples' Capitalism: The Economics of the Robot Revolution》和2011年出版的《Path to a Better World: A Plan for Prosperity, Opportunity, and Economic Justice》一书中深入探讨了这些问题和可能性。

4.4 个人偏好的信息经济

在机械化以前,人类出生就带有先天资本--自己的身体,用来生产各种有经济价值的产品。当技术降低了机械劳动价值的时候,身体的经济价值下降了,但是人脑内在的价值却增加了。如果人脑跟身体一样价值下降,那人类拥有什么内在价值呢?有趣的是,一种新的人类资本正在上升--个人偏好。

因特网公司提供搜索、电子邮件、地图和其他计算机工具软件,并通过用户使用这些工具软件收集了个人偏好--通常都是免费获得的。这些搜集到的信息之后被卖给广告商,广告商利用这些信息瞄准那些最有可能购买某些产品的人。这些公司的业务本质上就是利用个人偏好信息获取利益。现在许多人还没有意识到他们的个人偏好的价值,尽管这些公司收集和出售这些信息获取了客观的利益,由此已经充分证明了个人偏好的价值。

在将来的机器人经济里,人体和人脑的各种生理特性的经济价值会下降,但是个人偏好作为人类内在的价值还会继续存在。假如人们不那么轻易的把个人信息交出去,大家可以想象,在财富分配上起到重要作用的因特网公司就需要定期给那些提供个人信息的人予以补偿。

5、什么在阻碍机器人?

人脑不仅能够存储很多联想,还能快速调用这些记忆。人脑还将传感和其他信息转变成广义表示。对一些不重要的变化来说,这些广义表示是保持不变的。人脑还存储情景记忆,将学到的实例抽象成理解。有关机器人性能的、还没有解决的主要问题就是广义知识表达和基于这些表达的认知。计算机怎么能记住广义表达,并通过基于记忆的方法再找回这些广义表达呢?如何保证相似但不是雷同的情况会调用恰当的记忆和想法呢?

许多重要的线索都来自于对人脑的深入了解,有了新型的人脑图像工具,人们对大脑的理解速度加快了。一些机器学习算法,比如之前提到的深度学习,正被使用,试图自动发现广义表达。还不清楚这个问题多久会得到解决。也许只需要几年时间,有可能会更长一些。机器人性能已经取得了巨大的进步,但是我们还面临广义知识表达等难题,机器人性能的提升会浓墨重彩的开始,且很有可能是爆炸性的,对经济产出和人类的影响必然意义深刻。

参考文献

[1] Albus, James S. 1976. Peoples' Capitalism: The Economics of the Robot Revolution. New World Books.

[2] Albus, James S. 2011. Path To A Better World: A Plan for Prosperity, Opportunity , and Economic fustice. iUniverse.

[3] Bauer, Harald, Jan Veira, and Florian Weig. 2013. "Moore's Law: Repeal or Renewal?" McKinsey Global Institute, December. http://www.mckinsey. com/insights/high_tech_telecoms_internet/ moores_law_repeal_or_renewal.

[4] Brooks, Rodney. 2015. In the "Panel Discussion: Artificial Intelligence and the Future of Humans and Robots in the Economy." Malcolm and Carolyn Wiener Annual Lecture, Council on Foreign Relations, February 27, 2015. http://www.cfr. org/technology-and-science/artificial-intelligence -future-humans-robots-economy/p361 97.

[5] Cisco. 2015. "The Zettabyte Era - Trends and Analysis." White Paper, May. http://www. cisco.com/ c/en/ us/ solutions/ collateral/ service-provider/visual-networking-index-vni/ VNI_Hyperconnectivity_WP.html.

[6] Hilbert, Martin, and Priscila López. 2011. "The World's Technological Capacity to Store, Commu- nicate, and Compute Information." Science, April 1, 33(6025): 60-65.

[7] Kuffher, James J. 2010. "Cloud-Enabled Humanoid Robots." IEEE-RAS International Conference on Humanoid Robotics.

[8] Li, Fei-Fei. 2014. "The Digital Sensory System: A Quest for Visual Intelligence in Computers." Presentation at "Stanford Engi- neering's EngX: The Digital Sensory System" conference, May 20. https://www.youtube.com/ watch?v=ylVsqXzlJqA.

[9] Meeker, Mary. 2014. "Internet Trends 2014- Code Conference." May 28. http://www.kpcb. com/blog/ 20 1 4-internet-trends.

[10] Miret, Santiago. 2013. "Storage Wars: Batteries vs. Supercapacitors." Berkeley Energy and Resources Collaborative, November 10. http:// berc.berkeley.edu/storage-wars-batteries-vs -supercapacitors.

[11] Moore, Gordon. 1965. "Cramming More Components onto Integrated Circuits." Electronics Magazine, April 19, 38(8).

[12]  Moore, Gordon. 1975. "Progress in Digital Integrated Electronics." IEEE, IEDM Tech Digest. pp. 11-13.

[13] Parker, Andrew. 2003. In the Blink of an Eye: How Vision Sparked the Big Bang of Evolution. Basic Books.


[1] □ Gill A. Pratt下个月将从DARPA项目经理的位置卸任。在任期间,他负责DARPA机器人挑战赛和其他几个机器人项目。在此之前,他先后在弗兰克欧林理工学院和麻省理工学院工作。本文仅代表作者自己的观点,不代表其所服务的组织。

温馨提示
(0)

相关推荐