降噪，让决策“瞄”得准一点

本文来自微信公众号：中欧商业评论（ID：ceibs-cbr），作者：邓中华，原文标题：《决策失误，因为你被“噪声”影响了》，头图来自：《枪王之王》剧照

当知名企业跌倒，譬如选择了错误的上市时点，对丑闻的反应迟缓或者遮掩，未能预见政策风向致市值闪崩、投资人巨亏，发现选错接班人不得不行废立之举，过早采取激进的市场策略以致弄虚作假，免不了有“吃瓜群众”看戏不嫌事大，或被媒体刮骨式声讨，其尴尬与疼痛，恐不足为外人道也。

喧哗与骚动背后，往者虽不可谏，来者犹可追索。无论是当事人，还是物伤其类的其他人，都应当问一个问题：在决策时，判断是不是出现了严重的误差？如果是，它从何而来？将来，又该如何不贰过？

诺贝尔经济学奖得主丹尼尔·卡尼曼等长期研究人类决策中的误差。他和奥利维耶·西博尼、卡斯·桑斯坦合作的新著——《噪声：人类判断的缺陷》（Noise：A Flaw in Human Judgment，湛庐文化出品），所阐述的发现、原理、原则与策略，或可为指引。研究表明，尽管误差不可避免，但尽可能降低它的影响力，尤其是减少它对重大决策的纠缠，既非常必要，也切实可行。

“瞄不准”是常态

如果以射击为譬喻，误差就是子弹对靶心的偏离。它又分为两种，一种是因为瞄错了靶心，严重者甚至看错了靶，是整体偏离了目标，这是“偏差”；另一种是“噪声”，虽然目标明确，但落点却很离散。物理学有“测不准原理”，附会一下，可视噪声为“瞄不准”。它是人们在做判断的过程中不希望存在的分歧，是“本该相同的判断中存在的变异性”。

4支队伍

以射击为隐喻，A队几乎达到了理想模式；B队的每一发子弹都偏离了目标，因此我们称B队为偏差队；C队的子弹落点很分散，因此我们称它为噪声队；D队是偏差与噪声共存队。

不难发现，很多决策同时受偏差和噪声的困扰。相对而言，噪声对误差的“贡献”更大，其中一个重要原因是，偏差是可见的，而噪声则不易察觉，“很少有人认识到噪声的重要性。偏差是台上的主角，而噪声只是幕后一个不起眼的参与者”。

然而，有时候，噪声导致的后果之严重，足以让人瞠目结舌。例如，研究者在1981年邀请208名美国联邦法官，对16起完全相同的虚拟案件进行判决。结果表明，法官们仅对3起案件达成了监禁的一致判决，而且具体的刑期也宽幅震荡。面对一桩欺诈案，法官们判罚的平均刑期为8.5年，最长为终身监禁；另一起案件，平均刑期为1.1年，最长判罚为15年。

再比如，2012年，FBI委托认知心理学家做了一份研究，研究者邀请72名检验人员查看其在7个月前评估过的25对指纹，竟然有大约1/10的决策改变了。

卡尼曼等指出，“哪里有判断，哪里就会有噪声”。不管是重复性的日常决策，还是一次性的关键决策，都是如此，因此，“瞄不准”是常态。例如，他们的研究发现，保险公司的核保员所核保的中位数差异高达55%，远远超出高管的预期——10%。

再比如，很多公司流行“271”（20%超出期望，70%符合期望，10%低于期望），但绩效评估实事求是并公平吗？仅有25%反映了绩效表现，其他都是噪声。在人员招聘或晋升评估中，非结构化的面试对候选人的评分，与其实际的工作绩效评分的相关系数为0.28，换算成一致性百分比，约为56%~61%，也就是说，如果面试时认为甲比乙的潜力更大，甲在工作中实际如此的概率只有56%~61%，比掷硬币的50%高不了多少。所以，要以平常心看待人事决策中的看走眼。

复杂的决策，需要对一些变量做出评估和预测；而复杂这两个字意味着，常常有彼此矛盾的线索同时出现。这是它不同于计算的原因。另一方面，它与审美、品味的差异在于，审美和品味的多样性是可接受的，甚至是值得提倡的，而噪声是不受欢迎的，因为它让决策瞄不准。

三种噪声及来源

既然已知噪声妨碍了准确判断，本着知己知彼的精神，紧接着要问，噪声有哪些类型？它究竟来自哪里？

第一种，水平噪声。面对10个有罪的被诉，不同法官判罚的平均刑期会存在差异。这种差异就是水平噪声。它是不同个体在平均判断上的差异。为什么？一方面是人们的背景、秉性、阅历、倾向性、偏好有异；另一方面，判断量尺较为模糊，所以，相同的数字、表述可能含义有别。例如，禁止义务教育阶段的校外学科培训能否提升学生毕业后的创造性？显然，人们的看法不可能全然一致。造成不一致的一个原因很可能是，人们对如何衡量创造性、怎么才算提升了创造性的看法各异。

第二种，稳定的模式噪声。即同一个体对同一类对象判断的差异性。例如，一个理性乐观的投资人，一直看多，唯独对教培行业较为悲观。再比如，一位主张严刑峻法的法官，对白领犯罪却较为宽容，另一位法官可能刚好相反。据卡尼曼估计，此种噪声几乎是水平噪声的4倍之多。

第三种，“情境噪声”：不稳定的模式噪声。如果同一个人在不同场合下对同一件事的判断存在差异，即存在模式噪声。例如，“天气炎热时，司法审判会更严厉”；在阴天时，大学招生人员更关注候选人的学术特征，晴天时则对非学术特征更敏感，研究者为此拟了一个标题，“云让书呆子看起来不错”。

这些噪声之所以会产生，根本原因是“客观无知”，即存在不确定的未知之事和可知但不知之事。而判断就是要对一系列线索进行整合，并在相应的量尺上做出估测的过程。一个良好的判断应当是：搜集或识别的线索足够真实、丰富；赋予各个线索恰当的权重；对其程度的衡量足够准确。如果人们在这三点上保持一致，那么噪声就不会存在。但是，面对复杂的情境，人们很难发现相同、认定完全相同的线索，并给予同等的重要性排序，而且在估测时使用的量尺也不尽相同。

事实上，由于普遍存在的“自我服务偏差”（self-serving bias），人们常常以“中人以上”自居，喜欢听从直觉的呼唤和牵引，只会把各自心中有限线索和判断关联起来。例如，如果一个人三岁就会阅读，意味着他很聪明，因此，大概率会考个好大学。在将事实（三岁会阅读）和判断（考个好大学）匹配成连贯的因果性故事时，人们的内心会自动传递一种信号，一种让人愉悦的情感体验。

正是这个内部信号，让卡尼曼在《思考，快与慢》中所描述的各种启发式偏差才有了用武之地。常见的偏差有三大类：

（1）替代偏差，用相似性来做判断，忽略基础概率，用一个简单的问题替代复杂的问题。例如，气候问题真的存在吗？比尔·盖茨热衷于气候问题，但他离婚了，据说原因还不可描述，这样一个人如此关注气候问题，恐怕是小题大做；

（2）结论偏差，以结论去搜罗证据，例如，为什么阴谋论者不可辩驳、说服？因为阴谋论者搜罗到了很多与预判相一致的各种线索，甚至会发生这样的情况，为了自圆其说，没有线索，就在脑海里虚构线索；

（3）过度一致性，迅速形成第一印象，并始终维护这一印象，即使相矛盾的信息出现，也一以贯之。倘若判断者的偏差并不一致，噪声就会产生，现实也的确如此。

群体会放大噪声，“放大器”有两个。

第一，信息瀑布效应。率先陈述的人，开启了一个引导过程，将其他人卷进信息流之中。例如，在微博上，随机选择某条评论，人为地给出首赞，下一个访客点赞的可能性增加了32%；5个月后，其平均点赞率增加了25%。换句话说，“操弄”舆情竟然如此简单，只要给两个相反的意见各点个赞，就可能撮合群体间就歧见形成水火之势。

第二，群体极化。人们通过互相交流，往往会提出比原有倾向更极端的看法。为什么？如果有人支持他们的判断，判断者会变得更自信、更大胆；如果有相似的看法，人们倾向于通过加码来表明自己更胜一筹；如果有人试图一较高下，他们会在“结论偏差”的驱动下，对自己的看法更坚定、更执著。

“超级预测者”的两大特征

那么，该如何做，才能把噪声降低呢？

根本方法是，不断精进自己，成为“超级预测者”。超级预测者通常具有两大特征：第一，智商高；第二，拥有“积极开放性思维”。扪心自问，众人在智商上不过是普通人，因此，重点只能放在后者。

所谓积极开放性思维，是指“个体愿意积极搜寻与自己先前的假设相矛盾的信息”，包括其他人的不同意见，以及与原有看法不一致的新证据。超级预测者致力于更新看法，提高自我完善的程度，进行艰苦的研究工作，仔细地思考并自我反省、批判，汇总其他看法，喜欢“尝试-失败-分析-调整-再试一次”的思维循环。

例如，一个人相信必须消灭新冠病毒，但是，他也愿意主动搜寻与病毒共存相关的信息和证据，这就叫积极开放的大脑。如果一听人家说与病毒共存，就拿人家当异端邪说，非奸即盗，不由自主有拿起火把扔过去施以火刑的冲动，这显然就是消极的封闭性思维。

掌握积极开放性思维并不容易，对企业家和高管来说尤其如此。一方面，如前所述，他们偏好直觉，因为内在信号会给他们奖励，让他们愉悦，而积极开放充斥着限制与繁琐，要消耗大量的认知资源；另一方面，他们超级自信，业已认定自己就是超级预测者。

例如，有企业家大言不惭地说，“我永远都是对的”“我从不犯错”，或者，“要让黑天鹅飞在我们的咖啡杯中”。这些说辞，当然有鼓舞士气的需要，有语不惊人誓不休的营销意图。然而，倘若真的以为自己能抓住每一只蝴蝶的翅膀，那很可能意味着一个大的危机正在靠近。

决策降噪“六步走”

自我完善永无止境，而决策问题却纷至沓来。在成为合格的超级预测家之前，或可以考虑以下策略来降噪。

将决策结构化

研究已经表明，相比于人类的判断，即使是最简单的规则和算法也具有很大的优势，因为它们没有噪声，也不会尝试将复杂无效的变量纳入决策模型之中。举个例子，如果投资者设定了严格的止盈线、止损线，只要他严格遵守，那么获得合理的回报基本无虞；然而，如果投资者总是认为自己技高一筹，神乎其能、玄而又玄，可以买在谷底，卖在巅峰，那是“韭菜”无疑。

将决策结构化，旨在解决过度一致性产生的影响，具体的做法是，将决策问题分解为几个独立的任务，列出一份评估清单。它与结构化访谈类似。在结构化访谈中，访谈者一次只评估一个特征。

结构化的关键是独立评估，因此，要尽可能地将评估的任务分配给不同的团队。在组建评估团队时，应当遵循3个原则：

（1）尽可能引入“超级预测者”。区分真正的专家和“尊重型专家”，前者拥有可信赖的准确预测记录，后者虽然也顶着专家的名头，仅仅是因为同行尊重他们，例如，“很多教授、学者和管理顾问就是尊重型专家”；

（2）评估者具有多样化的技能及互补的判断模式，例如既有悲观者，又有乐观者；

（3）评估者和被评估对象没有利益相关性。

评估采取外部视角

常规思维模式只关注当前的案例，将其纳入因果性故事逻辑之中，其结果是，模式噪声分外突出。外部视角使用统计性思维，关注基础概率，将某个案例归为一系列案例中的一例，而非把它当做特例。例如，预测一个强势企业家三年内是否会退休，除了了解预测对象的个人信息，还必须关注基准概率，企业家“正常”退休的可能性有多大？

评估须相互独立

一方面，我们应当激活“群体智慧效应”，毕竟，“三个臭裨将，顶个诸葛亮”；另一方面，切记，群体会放大噪声，而不是相反。实现1+1＞2的关键是各自独立判断，然后把它们汇总。

如果没有足够的人员，那么同一个评估人员最好承担完全不同的评估项目，而且，应该在完成第一项后再开始第二项。一种极端的情况是，由一个人做出全部评估，例如独裁型企业家考察他/她的继任者。此时，这位评估者应该多次评估，并对前后评估进行平均，这种技术被命名为“辩证自助法”。

它是两种传统智慧的结合。其一，“三思而后行”，注意，多次评估需间隔一定的时间，以消除情境噪声；其二，“左右手互博”，质疑先前的判断，从一个新的角度来看待被评估对象。然而，最好是寻求第三方的看法，因为“两个即刻、连续的辩证性自助评估在判断准确度上的获益，是寻求他人意见的一半”。

在决策会议上分别审核每项评估

把每一单项的评审视为一个独立的项目议程。例如，一个并购决策，被结构化为战略目标、行业前景、标的价值、整合难度、反垄断审查风险等，那么，决策会议应该逐项分别审核，而不是毕其功于一役。

使用“评估-讨论-再评估”方法

这种方法又名“迷你德尔菲法”。当评估者阐释了某一项的关键事实后，决策者此时先对该项做出独立评分，并以匿名的方式将评分呈现给大家，以减少信息瀑布和群体极化效应。如果大家的意见一致，则进入下一项；如果不一致，那么就进行讨论，务求有分歧的决策者发言，决策者再进行评估。最后，以某种方法，如取平均值、汇总。

推迟使用直觉，而非禁止直觉

盲人摸象隐喻的便是直觉性判断。如果已经认定大象如墙或柱，那么，其他人说什么，都很难听进去。推迟使用直觉，旨在确保直觉建立在一定的信息基础之上，考虑了各个方面，而不是一开始就爱屋及乌。

尾声

噪声是决策者的隐形敌人，它无处不在。商业、刑事司法、医学、指纹分析、天气预报、绩效评估、人员选拔等领域的案例及研究表明，噪声之多、影响之大，远超人们的想象。

尽管彻底消除噪声是得不偿失的，但无视它、轻视它却不明智。降噪应当成为一种有意识的行为，尽管它有些繁琐、反直觉、甚至“反人性”，要付出一定的代价，然而，如果事关重大，不妨矫枉过正，像洁癖对待环境卫生一样提高决策卫生。

本文来自微信公众号：中欧商业评论（ID：ceibs-cbr），作者：邓中华

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/128239.html

降噪，让决策“瞄”得准一点

相关推荐

发表回复