降噪,让决策“瞄”得准一点
本文来自微信公众号:中欧商业评论(ID:ceibs-cbr),作者:邓中华,原文标题:《决策失误,因为你被“噪声”影响了》,头图来自:《枪王之王》剧照
当知名企业跌倒,譬如选择了错误的上市时点,对丑闻的反应迟缓或者遮掩,未能预见政策风向致市值闪崩、投资人巨亏,发现选错接班人不得不行废立之举,过早采取激进的市场策略以致弄虚作假,免不了有“吃瓜群众”看戏不嫌事大,或被媒体刮骨式声讨,其尴尬与疼痛,恐不足为外人道也。
喧哗与骚动背后,往者虽不可谏,来者犹可追索。无论是当事人,还是物伤其类的其他人,都应当问一个问题:在决策时,判断是不是出现了严重的误差?如果是,它从何而来?将来,又该如何不贰过?
诺贝尔经济学奖得主丹尼尔·卡尼曼等长期研究人类决策中的误差。他和奥利维耶·西博尼、卡斯·桑斯坦合作的新著——《噪声:人类判断的缺陷》(Noise:A Flaw in Human Judgment,湛庐文化出品),所阐述的发现、原理、原则与策略,或可为指引。研究表明,尽管误差不可避免,但尽可能降低它的影响力,尤其是减少它对重大决策的纠缠,既非常必要,也切实可行。
“瞄不准”是常态
如果以射击为譬喻,误差就是子弹对靶心的偏离。它又分为两种,一种是因为瞄错了靶心,严重者甚至看错了靶,是整体偏离了目标,这是“偏差”;另一种是“噪声”,虽然目标明确,但落点却很离散。物理学有“测不准原理”,附会一下,可视噪声为“瞄不准”。它是人们在做判断的过程中不希望存在的分歧,是“本该相同的判断中存在的变异性”。
4支队伍
以射击为隐喻,A队几乎达到了理想模式;B队的每一发子弹都偏离了目标,因此我们称B队为偏差队;C队的子弹落点很分散,因此我们称它为噪声队;D队是偏差与噪声共存队。
不难发现,很多决策同时受偏差和噪声的困扰。相对而言,噪声对误差的“贡献”更大,其中一个重要原因是,偏差是可见的,而噪声则不易察觉,“很少有人认识到噪声的重要性。偏差是台上的主角,而噪声只是幕后一个不起眼的参与者”。
然而,有时候,噪声导致的后果之严重,足以让人瞠目结舌。例如,研究者在1981年邀请208名美国联邦法官,对16起完全相同的虚拟案件进行判决。结果表明,法官们仅对3起案件达成了监禁的一致判决,而且具体的刑期也宽幅震荡。面对一桩欺诈案,法官们判罚的平均刑期为8.5年,最长为终身监禁;另一起案件,平均刑期为1.1年,最长判罚为15年。
再比如,2012年,FBI委托认知心理学家做了一份研究,研究者邀请72名检验人员查看其在7个月前评估过的25对指纹,竟然有大约1/10的决策改变了。
卡尼曼等指出,“哪里有判断,哪里就会有噪声”。不管是重复性的日常决策,还是一次性的关键决策,都是如此,因此,“瞄不准”是常态。例如,他们的研究发现,保险公司的核保员所核保的中位数差异高达55%,远远超出高管的预期——10%。
再比如,很多公司流行“271”(20%超出期望,70%符合期望,10%低于期望),但绩效评估实事求是并公平吗?仅有25%反映了绩效表现,其他都是噪声。在人员招聘或晋升评估中,非结构化的面试对候选人的评分,与其实际的工作绩效评分的相关系数为0.28,换算成一致性百分比,约为56%~61%,也就是说,如果面试时认为甲比乙的潜力更大,甲在工作中实际如此的概率只有56%~61%,比掷硬币的50%高不了多少。所以,要以平常心看待人事决策中的看走眼。
复杂的决策,需要对一些变量做出评估和预测;而复杂这两个字意味着,常常有彼此矛盾的线索同时出现。这是它不同于计算的原因。另一方面,它与审美、品味的差异在于,审美和品味的多样性是可接受的,甚至是值得提倡的,而噪声是不受欢迎的,因为它让决策瞄不准。
三种噪声及来源
既然已知噪声妨碍了准确判断,本着知己知彼的精神,紧接着要问,噪声有哪些类型?它究竟来自哪里?
第一种,水平噪声。面对10个有罪的被诉,不同法官判罚的平均刑期会存在差异。这种差异就是水平噪声。它是不同个体在平均判断上的差异。为什么?一方面是人们的背景、秉性、阅历、倾向性、偏好有异;另一方面,判断量尺较为模糊,所以,相同的数字、表述可能含义有别。例如,禁止义务教育阶段的校外学科培训能否提升学生毕业后的创造性?显然,人们的看法不可能全然一致。造成不一致的一个原因很可能是,人们对如何衡量创造性、怎么才算提升了创造性的看法各异。
第二种,稳定的模式噪声。即同一个体对同一类对象判断的差异性。例如,一个理性乐观的投资人,一直看多,唯独对教培行业较为悲观。再比如,一位主张严刑峻法的法官,对白领犯罪却较为宽容,另一位法官可能刚好相反。据卡尼曼估计,此种噪声几乎是水平噪声的4倍之多。
第三种,“情境噪声”:不稳定的模式噪声。如果同一个人在不同场合下对同一件事的判断存在差异,即存在模式噪声。例如,“天气炎热时,司法审判会更严厉”;在阴天时,大学招生人员更关注候选人的学术特征,晴天时则对非学术特征更敏感,研究者为此拟了一个标题,“云让书呆子看起来不错”。
这些噪声之所以会产生,根本原因是“客观无知”,即存在不确定的未知之事和可知但不知之事。而判断就是要对一系列线索进行整合,并在相应的量尺上做出估测的过程。一个良好的判断应当是:搜集或识别的线索足够真实、丰富;赋予各个线索恰当的权重;对其程度的衡量足够准确。如果人们在这三点上保持一致,那么噪声就不会存在。但是,面对复杂的情境,人们很难发现相同、认定完全相同的线索,并给予同等的重要性排序,而且在估测时使用的量尺也不尽相同。
事实上,由于普遍存在的“自我服务偏差”(self-serving bias),人们常常以“中人以上”自居,喜欢听从直觉的呼唤和牵引,只会把各自心中有限线索和判断关联起来。例如,如果一个人三岁就会阅读,意味着他很聪明,因此,大概率会考个好大学。在将事实(三岁会阅读)和判断(考个好大学)匹配成连贯的因果性故事时,人们的内心会自动传递一种信号,一种让人愉悦的情感体验。
正是这个内部信号,让卡尼曼在《思考,快与慢》中所描述的各种启发式偏差才有了用武之地。常见的偏差有三大类:
(1)替代偏差,用相似性来做判断,忽略基础概率,用一个简单的问题替代复杂的问题。例如,气候问题真的存在吗?比尔·盖茨热衷于气候问题,但他离婚了,据说原因还不可描述,这样一个人如此关注气候问题,恐怕是小题大做;
(2)结论偏差,以结论去搜罗证据,例如,为什么阴谋论者不可辩驳、说服?因为阴谋论者搜罗到了很多与预判相一致的各种线索,甚至会发生这样的情况,为了自圆其说,没有线索,就在脑海里虚构线索;
(3)过度一致性,迅速形成第一印象,并始终维护这一印象,即使相矛盾的信息出现,也一以贯之。倘若判断者的偏差并不一致,噪声就会产生,现实也的确如此。
群体会放大噪声,“放大器”有两个。
第一,信息瀑布效应。率先陈述的人,开启了一个引导过程,将其他人卷进信息流之中。例如,在微博上,随机选择某条评论,人为地给出首赞,下一个访客点赞的可能性增加了32%;5个月后,其平均点赞率增加了25%。换句话说,“操弄”舆情竟然如此简单,只要给两个相反的意见各点个赞,就可能撮合群体间就歧见形成水火之势。
第二,群体极化。人们通过互相交流,往往会提出比原有倾向更极端的看法。为什么?如果有人支持他们的判断,判断者会变得更自信、更大胆;如果有相似的看法,人们倾向于通过加码来表明自己更胜一筹;如果有人试图一较高下,他们会在“结论偏差”的驱动下,对自己的看法更坚定、更执著。
“超级预测者”的两大特征
那么,该如何做,才能把噪声降低呢?
根本方法是,不断精进自己,成为“超级预测者”。超级预测者通常具有两大特征:第一,智商高;第二,拥有“积极开放性思维”。扪心自问,众人在智商上不过是普通人,因此,重点只能放在后者。
所谓积极开放性思维,是指“个体愿意积极搜寻与自己先前的假设相矛盾的信息”,包括其他人的不同意见,以及与原有看法不一致的新证据。超级预测者致力于更新看法,提高自我完善的程度,进行艰苦的研究工作,仔细地思考并自我反省、批判,汇总其他看法,喜欢“尝试-失败-分析-调整-再试一次”的思维循环。
例如,一个人相信必须消灭新冠病毒,但是,他也愿意主动搜寻与病毒共存相关的信息和证据,这就叫积极开放的大脑。如果一听人家说与病毒共存,就拿人家当异端邪说,非奸即盗,不由自主有拿起火把扔过去施以火刑的冲动,这显然就是消极的封闭性思维。
掌握积极开放性思维并不容易,对企业家和高管来说尤其如此。一方面,如前所述,他们偏好直觉,因为内在信号会给他们奖励,让他们愉悦,而积极开放充斥着限制与繁琐,要消耗大量的认知资源;另一方面,他们超级自信,业已认定自己就是超级预测者。
例如,有企业家大言不惭地说,“我永远都是对的”“我从不犯错”,或者,“要让黑天鹅飞在我们的咖啡杯中”。这些说辞,当然有鼓舞士气的需要,有语不惊人誓不休的营销意图。然而,倘若真的以为自己能抓住每一只蝴蝶的翅膀,那很可能意味着一个大的危机正在靠近。
决策降噪“六步走”
自我完善永无止境,而决策问题却纷至沓来。在成为合格的超级预测家之前,或可以考虑以下策略来降噪。
将决策结构化
研究已经表明,相比于人类的判断,即使是最简单的规则和算法也具有很大的优势,因为它们没有噪声,也不会尝试将复杂无效的变量纳入决策模型之中。举个例子,如果投资者设定了严格的止盈线、止损线,只要他严格遵守,那么获得合理的回报基本无虞;然而,如果投资者总是认为自己技高一筹,神乎其能、玄而又玄,可以买在谷底,卖在巅峰,那是“韭菜”无疑。
将决策结构化,旨在解决过度一致性产生的影响,具体的做法是,将决策问题分解为几个独立的任务,列出一份评估清单。它与结构化访谈类似。在结构化访谈中,访谈者一次只评估一个特征。
结构化的关键是独立评估,因此,要尽可能地将评估的任务分配给不同的团队。在组建评估团队时,应当遵循3个原则:
(1)尽可能引入“超级预测者”。区分真正的专家和“尊重型专家”,前者拥有可信赖的准确预测记录,后者虽然也顶着专家的名头,仅仅是因为同行尊重他们,例如,“很多教授、学者和管理顾问就是尊重型专家”;
(2)评估者具有多样化的技能及互补的判断模式,例如既有悲观者,又有乐观者;
(3)评估者和被评估对象没有利益相关性。
评估采取外部视角
常规思维模式只关注当前的案例,将其纳入因果性故事逻辑之中,其结果是,模式噪声分外突出。外部视角使用统计性思维,关注基础概率,将某个案例归为一系列案例中的一例,而非把它当做特例。例如,预测一个强势企业家三年内是否会退休,除了了解预测对象的个人信息,还必须关注基准概率,企业家“正常”退休的可能性有多大?
评估须相互独立
一方面,我们应当激活“群体智慧效应”,毕竟,“三个臭裨将,顶个诸葛亮”;另一方面,切记,群体会放大噪声,而不是相反。实现1+1>2的关键是各自独立判断,然后把它们汇总。
如果没有足够的人员,那么同一个评估人员最好承担完全不同的评估项目,而且,应该在完成第一项后再开始第二项。一种极端的情况是,由一个人做出全部评估,例如独裁型企业家考察他/她的继任者。此时,这位评估者应该多次评估,并对前后评估进行平均,这种技术被命名为“辩证自助法”。
它是两种传统智慧的结合。其一,“三思而后行”,注意,多次评估需间隔一定的时间,以消除情境噪声;其二,“左右手互博”,质疑先前的判断,从一个新的角度来看待被评估对象。然而,最好是寻求第三方的看法,因为“两个即刻、连续的辩证性自助评估在判断准确度上的获益,是寻求他人意见的一半”。
在决策会议上分别审核每项评估
把每一单项的评审视为一个独立的项目议程。例如,一个并购决策,被结构化为战略目标、行业前景、标的价值、整合难度、反垄断审查风险等,那么,决策会议应该逐项分别审核,而不是毕其功于一役。
使用“评估-讨论-再评估”方法
这种方法又名“迷你德尔菲法”。当评估者阐释了某一项的关键事实后,决策者此时先对该项做出独立评分,并以匿名的方式将评分呈现给大家,以减少信息瀑布和群体极化效应。如果大家的意见一致,则进入下一项;如果不一致,那么就进行讨论,务求有分歧的决策者发言,决策者再进行评估。最后,以某种方法,如取平均值、汇总。
推迟使用直觉,而非禁止直觉
盲人摸象隐喻的便是直觉性判断。如果已经认定大象如墙或柱,那么,其他人说什么,都很难听进去。推迟使用直觉,旨在确保直觉建立在一定的信息基础之上,考虑了各个方面,而不是一开始就爱屋及乌。
尾声
噪声是决策者的隐形敌人,它无处不在。商业、刑事司法、医学、指纹分析、天气预报、绩效评估、人员选拔等领域的案例及研究表明,噪声之多、影响之大,远超人们的想象。
尽管彻底消除噪声是得不偿失的,但无视它、轻视它却不明智。降噪应当成为一种有意识的行为,尽管它有些繁琐、反直觉、甚至“反人性”,要付出一定的代价,然而,如果事关重大,不妨矫枉过正,像洁癖对待环境卫生一样提高决策卫生。