寻找超级坚固性
——在灾难中迅速恢复的系统
文/姚斌
我最早知道邓肯·瓦茨,是他的《反常识》一书中。也就是在那本书中,我知道了“六度分隔”,但也仅此而已,没有去深究。直到最近,我才真正读到了他的《六度分隔》。邓肯·瓦茨也在圣塔菲研究所工作,他的研究方向集中于网络结构在各种各样的系统中的作用和地位。
复杂系统因为其组件形成系统的方式,它们能够相互作用、相互影响,即使很简单的组件,也会涌现出复杂的行为。而相互作用和相互关系的复杂性正是复杂性科学研究的主要议题。复杂系统内的众多对象相互按某种方式彼此连接在一起,就形成了网络。网络是动态的,把网络看成是持续演化、不断自我重构的系统整体部分,这是当今网络科学的核心内容。在这其中,六度分隔又是一个重要的议题。
六度分隔,又被称为“小世界现象”,最早来自哈佛大学社会心理学教授斯坦利·米格拉姆。1967年,米格拉姆想要描绘一个连结人与社区的人际联系网,进行一次不寻常的实验,结果发现了六度分隔现象:“你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。”于是,米格拉姆试验就提供了关于社会网络的思维框架:一方面,世界是高度集群性,我们的许多朋友之间也是朋友;另一方面,我们仍然可以通过屈指可数的几层关系,联系上这个世界的任何人。
邓肯·瓦茨的最大贡献就是将六度分隔的概念引入物理学、生物学、社会学、管理学、经济学以及企业演化等方面,从而产生了许多深刻而有趣的洞见。以下是丰田汽车公司的一个案例,它说明了六度分隔在其中发挥的重大作用。
1
丰田汽车大约由200个公司构成,因供应丰田从电子零件到坐垫等所有部件而形成了具有共同利益的群体,这就是众所周知的丰田生产系统。丰田是现代精准企业概念的典范,被全世界的管理学家作为效率与创造性完美结合的光辉榜样。
爱信精密最早是丰田公司的一个部门,1949年它脱离出来成为一个单独的公司,集中于刹车部件制造这一特定行业。爱信生产的一种被称为P-阀门的设备应用于所有的丰田汽车中,通过控制后刹车上的压力来辅助防滑。P-阀门只有一包香烟大小,并不复杂,但因为其角色至关重要而必须精确制造。由于爱信毫无瑕疵的生产记录,到1997年已成为丰田P-阀门的唯一供应商。并且因为追求效率,爱信将其所有P-阀门生产线集中安装在一个工厂里,这就是刈谷第一工厂,当时它每天生产32500个阀门。最终,由于它实行成功的实时库存系统,丰田只需要保留大约两天的P-阀门存量就可以了。因此,刈谷第一工厂的生产成为丰田供应链中最为关键的环节。没有刈谷第一工厂就没有阀门,没有阀门就没有刹车,没有刹车就没有汽车。
1997年2月1日,刈谷第一工厂突然失火,所有P-阀门的生产线,包括离合器、气缸以及爱信为了制造和质量控制的所有专用设备都被毁了。仅仅5个小时,爱信生产P-阀门的全部生产能力丧失殆尽,重建需要好几个月。当时丰田运行着大约30条生产线,每天出厂超过15000辆汽车。到2月5日,所有的生产都陷入停顿,不仅是丰田,还有所有与丰田相关的服务商与供应商。丰田集团就像神话中的巨人哥利亚一样,被一块正中要害的石头打倒了。有人称,这个灾难仅次于阪神大地震,使得整个世界汽车行业目瞪口呆。
然而,仅仅过了三天,超过100种的新P-阀门的生产就恢复了。到2月6日,丰田的两个工厂重新开工,灾难过后一周,汽车的日产量已经恢复到14000辆。再经过一周,日产量就恢复到灾难之前的水平。这就使得这场灾难极具戏剧性。这是通过超过200个公司令人惊讶的、步调一致的努力。这些公司只有很少几家成为P-阀门的应急生产者,有超过150个公司作为供应商参与此事,而它们之前并没有制造阀门的经验,更没有大火中烧毁的那些专用设备。有一个叫“兄弟”的公司也参与了恢复工作,但其实这是一家缝纫机制造商,根本没有生产过汽车零件。所以,有趣的问题不是它们为什么参与了这场戏剧性的恢复活动,而是它们是如何参与的。
当大火尚未熄灭的时候,爱信的当班工程师立即评估了危险,并且准确地确定了当时他们必须做的事情。他们立即意识到将要来到的恢复的重任,尽可能降低灾难带来的损失。作为一个公司,许多恢复的工作已经超出了他们能力范围,超出了他们可以直接提供的努力。恢复灾难需要更大范围的、不在他们控制之内的努力。然而,在这种情况中,提供帮助本身就是一件困难的事情,因为这些公司缺乏生产P-阀门的工具和专用技术。
此时,以前所有的训练和积累开始发挥作用了。丰田生产系统的多年经历使得集团中的所有公司,对如何应对和解决问题有着共同的理解。对它们来说,设计和工程事故两者并行已经是常规的活动方式。爱信公司是知道这一点的,所以它只需要用最简明的语言表达需求,从而给这些潜在的供应商,在决定实施细节的时候留出最大的自由空间。在参与恢复行动的许多公司之间,以前都曾和爱信公司有过人员交流和技术交流活动,它们彼此之间也有经常性的交流。因此,它们可以用电话联系、共享资源信息以及人员之间业已存在的社会联系等方法进行沟通。它们彼此之间相互理解、相互信任,每一项安排不仅仅是信息的快速传送,而且是一种动员和对提供资源的承诺。
有些公司还对于自己的生产优先次序进行了重新安排,以便支持恢复工作,为此它们削减了其他工作,或者把技术性不那么强的工作外包出去。另一些公司在全国到处寻找和租用钻头以及相关的测量仪表,甚至到美国去找,为此清空了橱窗,而不顾这样做的代价和后果。丰田集团从两方面入手。一方面,它把主要损失压力从一个公司分散到几百个公司身上,从而使集团中所有成员的损失都能够最小化;另一方面,它迅速地重新组合分散在各地各公司的、类似相关的资源,以便尽快生产出一批P-阀门的替代产品。它们在完成这些任务的时候并没有造成新的问题或故障,其中很少有集中的指令,几乎没有正式的合同,所有这些是在三天内完成的。
2
在爱信的这个案例中,它是在几乎没有中央控制的情况下,系统迅速地恢复过来,就像是死而复生一样。在工程师的眼中,这样自我修复的系统是很有吸引力的,而我们的世界似乎就是这样组织起来的。从爱信危机的例子中,我们可以学到如何设计一个系统,是它能够自己从潜在的、毁灭性的打击中恢复起来。
现代公司理论都立足于这样一个假设:即使一项复杂的工作是分散的、有许多技术工人并行完成的,但是其设计总是要集中、自上而下地进行。来自圣塔菲研究所的经济学家查尔斯·萨贝尔和他的合作者麦克·皮奥里并不这样认为。他们宣称,现代公司理论不符合实际情况。大规模的、纵向集成的层次结构只是公司的一种特殊形态而已。回顾19世纪末,在产业和公司的现代形式刚刚出现的时候,这种层级结构并不是仅有的成功模式,而且也不是基于一般经济原则的、最终得到证明是最优的模式。
于是,他们提出了“灵活的专业化”:现代公司所要完成的任务是无从预测的、迅速变化的,从建造新型号的汽车到为春季时装目录提供新一波的面料,再到设计新的计算机操作系统,都是如此。在这样的环境中,企业不再投入大量的资本去建立专门的生产设施,而是以接受范围经济的方式培育由具有高技能的工人组成的灵活的团队,以便能够迅速地、反复地进行重组,生产多品种、小批量的产品。然而,这种方法又掩盖了一种更为深层次的模糊性——不仅公司面临的外部市场造成的关于究竟要生产什么的不确定性,在内部究竟如何完成相关的任务也是不确定性的,包括相应的成功因素究竟是什么。
萨贝尔认为,程序化地解决问题的机制对于现代企业应对模糊性越来越大的商业环境来说,是至关重要的基本功能。这是我们理解像丰田集团这样的企业复杂结构的关键,包括它们能够从爱信危机这样打击中迅速恢复的能力是从何而来的。但是,目前的公司理论并没有跟上这种变化。经济学家虽然渴望建立严格的分析模型,但却始终不想考虑现代产业组织中内在的、必然的模糊性,也不把它吸收到自己的理论中来。于是,经济理论基本上还停留在市场和层次结构的二元体系时代,而忽视了解决问题和处理危机的机制。社会学家和企业分析师虽然对适应性和坚固性是很感兴趣的,但他们也没有能够把这样的分析纳入他们的模型之中,也没有从理论上提出替代方案,进而回答市场和层次结构的优化问题。
萨贝尔确信,模糊性和问题求解是企业行为的核心,而且是有确切的数学框架的。企业中的个人也是从自己的角度出发,做出和其他人相关的决策,而且这种决策会产生全局性的后果。面对模糊环境中的复杂系统,人们总是受制于各项任务之间的相互关系以及对于无法预测的未来的知识不足,因而需要和组织内一起承担这项任务的其他人交换信息,包括知识、经验、建议、资源等等。换句话说,模糊性要求相互依存的人们之间的沟通,交流信息和资源。当环境迅速变化的时候,频繁的交流就变得更加紧迫。从长远来说,应对模糊性的问题,相当于分布式的沟通问题,或者称为广义的通信问题。如果一个企业的内部没有有效的、分布式的沟通渠道,那它就不能有效地解决问题,不能有效地应对模糊性和变革。
许多大规模的产业组织,从丰田集团到整个经济体系,都呈现出层次结构,甚至许多物理的网络也是按层次结构的原则建造的。层次结构仍然是现代企业的一个重要属性。组织网络不同于其他网络的另一个重要特点是,每个人可做的工作是有限的。这种限制对于现代企业必须执行的生产和信息处理两大任务都有重要的影响。一个具有坚固性的信息处理网络,不仅需要合理分配生产的负担,而且要尽量分散信息处理的负担,控制信息处理的数量,以避免过载导致的崩溃。
3
组织的失效是由许多不同情况、不同规模的,有的时候这些灾难来自外部,有的时候则源自其内部。还有的时候,比如爱信的灾难,是内外两方面合力的原因。火灾是自然的原因,但是由爱信独家生产刹车阀门以及实时库存管理系统则是其内在根源。不管什么原因,任何灾难都是整个系统某个部分的功能失效或停止工作。从长期来说,这些功能需要修复或重建,还有的时候是由其他部分承担这些功能。
正如我们从爱信危机中看到的,作为灾难的必然后果之一,任何灾难都将导致问题求解和信息共享的需求大大增加。当系统的某项关键资源突然丧失的时候,组织需要显示出来的最重要的能力,就是能够很容易地调动还保有的资源。所以,用网络的语言来说,在短期内应对灾难的关键是网络必须保持连通,以阻止失效情况的进一步扩展,这样做就可以尽快回到常规。
一个太过集中的层次结构十分容易导致网络中大量分支陷于孤立。但如果是多尺度网络,就根本不存在那种一旦失效就会导致整个网络断开的崩溃。所以,多尺度网络对于处于不确定环境中的企业来说,可以用来达到两个重要的、基本的目标。通过在各种尺度上把与问题求解相关的信息拥堵分散化,这样网络就可以大大减少各种故障发生的可能性。而一旦故障发生,它又能够使故障的危害最小化,这样一来,多尺度网络就实现了真正的坚固性,即不仅避免了故障的发生,而且能够用最小的代价进行纠正和恢复,因为它实现了这样一举两得的坚固性,这就是邓肯·瓦茨所谓的“超级坚固性”。
所谓的超级坚固性,无非就是从各个方面应对模糊性而已。有的时候模糊性是日常的、习以为常的,而有的时候则是极端的、少见的。但是它们共同点在于,人们都是面对一个不熟悉的问题,而且需要尽快解决。所以,在一个场合下行之有效的、一般化的、科学的应对机制,通常也可以用在另一个场合。创新、纠错以及灾难恢复,从根本上都是同一个问题的不同版本,这就是对模糊性的应对。
从这样的角度来看,丰田集团事先没有计划的、奇迹般的迅速恢复,其实并没有什么奇怪的。人们突然发现自己面对这一个从未想象到的局面,而且是一个简直不相信自己能够应付的局面,但是他们没有选择,必须面对这个戏剧性地变化了的世界。无论如何,他们解决了这个问题,并且表现出他们自己都不知道的组织的、集体的巨大能力。丰田集团的员工们面对如此巨大的灾难表现出色,但他们并不是超人。在某种意义上,这种危机处理只不过是他们处理日常问题的升级版而已。
无论如何分析,模糊性总还是模糊的东西,但现在我们终于可以定义它、理解它了。一方面,环境中持续不断的模糊性,不断地颠覆已有的工作程序,使现有的解决方案成为过时的东西,这就是公司面对许多问题的外部根源;另一方面,这种情况又使得问题求解成为例行的活动,迫使企业形成能够处理大量信息而不至于拥堵和崩溃的结构,从这个意义上说,这种天天遇到的模糊性又是企业的好朋友。
如果丰田公司没有找到处理爱信灾难的方法,那么可以想象,全世界的用户可能会突然失去钟爱的丰田汽车,爱信可能会连续几个月成为报刊的头版头条。而且不仅是丰田,可能近200家供应商中的大部分商家也会面临倒闭,可能会成为近10年来最大的事件之一。然而,现在除了少数一些工业组织专家外,没有人听说过爱信危机。因为它对全球经济的影响十分有限,只是历史上一件无足轻重的事。
一个连通的、分布式的系统,从电网到企业甚至是整个经济,这种系统不仅比孤立的实体更脆弱,也比孤立的实体更坚固。如果两个人被一个不长的影响链连接起来,那么其中一个人发生的事情可能会影响到另一个,即使他们完全不知道彼此。如果这种影响是有破坏性的,那么连接起来的他们比他们单独时更脆弱。另一方面,如果他们能通过一个连接找到一个对方,或者他们处于一个能互相强化的网络关系中,那么每一个人都能比单独时经受住更大的风暴。这样看来,网络科学向我们展示它的确是一门新科学,但并不属于任何传统科学,而是同时穿越了智力界限并应用了很多学科。