幸存者偏见

幸存者偏见,是一种常见的逻辑谬误。

意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。

这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。


“幸存者偏见”解读

如果用一句通俗的话来概括“幸存者偏见”,就是【死人没法开口】。

如果要说得更具体点,那就是:

当你在分析某个事物的时候,可能会面对诸多的证据(样本)。但是大多数人通常只注意到【显式】的样本和证据,而忽略了【隐式】的样本和证据。从而得出错误的认知、错误的结论。

为了更形象一些,来说一下“幸存者偏见”的出处——古罗马的西赛罗(与凯撒同时代的知名政治家、文学家、演说家)讲过一个故事,大意如下:

有一群宗教信徒在某次沉船事故中幸存。幸存后,他们就找人作画(画面上是一群人在事故中祈祷),以此来宣扬说:因为他们作了虔诚的祷告,所以才在沉船事故中幸存。

某信徒拿了这幅画给一个无神论者看。这个无神论者直接反问道:那些祈祷之后淹死的人,他们的画像在哪里?

以上就是“幸存者偏见”的出处。那些“祈祷之后依然淹死的人”,他们已经死了,不可能再去告诉别人,他们的祈祷失灵了。   


“幸存者偏见”案例分析

◇【战争】飞机防护

1941年,第二次世界大战中,美国哥伦比亚大学统计学沃德教授应军方要求,利用其在统计方面的专业知识来提供关于《飞机应该如何加强防护,才能降低被炮火击落的几率》的相关建议。

沃德教授针对联军的轰炸机遭受攻击后的数据,进行研究后发现:机翼是最容易被击中的位置,机尾则是最少被击中的位置。

沃德教授的结论是“我们应该强化机尾的防护”,而军方指挥官认为“应该加强机翼的防护,因为这是最容易被击中的位置”。

沃德教授坚持认为:

  • (1)统计的样本,只涵盖平安返回的轰炸机;
  • (2)被多次击中机翼的轰炸机,似乎还是能够安全返航;
  • (3)而在机尾的位置,很少发现弹孔的原因并非真的不会中弹,而是一旦中弹,其安全返航的概率就微乎其微。

军方采用了教授的建议,并且后来证实该决策是正确的,看不见的弹痕却最致命!

这个故事有两个启示:

一是战死或被俘的飞行员无法发表意见,所以弹痕数据的来源本身就有严重的偏误;

二是作战经验丰富的飞行员的专业意见也不一定能提升决策的质量,因为这些飞行员大多是机翼中弹而机尾未中弹的幸存者。

◇【IT】领域——创业的“银弹”

作为IT从业人员,经常在某些IT网站上看到某某公司的创业事迹。如果你也跟我一样,估计这方面的故事也看了不少。

不知你有没有发现,那些广为流传的创业案例,都是【成功】案例。

越成功的,越具有传奇色彩,被宣传的次数就越多(比如:乔布斯、盖茨)。相反,那些创业【失败】的案例,(相比而言)被提及的次数非常非常少。

这会产生啥问题呢?

假设某个有志青年想要创业,他看了很多创业成功的案例,这些案例都提到某些共同的因素。

于是,此人就误以为这些共同的因素是“银弹”——只要具备这些银弹,创业必定成功。这就如同西赛罗的那个故事——只看到存活的祈祷者,就误以为“祈祷”是存活的【充分条件】。

◇【成功学】领域——虚假的“充分条件”

说完“创业”,很自然就联想到“成功学”。那些鼓吹“成功学”的文章/书籍,通常存在很多谬误,其中一个谬误是——号称“某某方法论”是成功的【充分条件】。

换句话说,只要具备了该方法论,就一定可以获得成功。

为啥说这是一个谬误?

因为这些鼓吹成功学的文章/书籍,通常都【没有】去检验——该方法论是否也出现在失败者身上。

只要有一个失败者也采用了该方法论,就足以说明——这个方法论【不是】成功的充分条件。

比如说,很多成功学的理论提到了“勤奋”是成功的充分条件。但其实,勤奋而没有成功的,大有人在。

所以,“勤奋”显然不是“成功”的充分条件;甚至也不是“必要条件”。


“幸存者偏见”导致的问题

接下来,总结一下“幸存者偏见”可能导致的问题——分三个方面。

错误的认知

这个最好理解了——由于“错误的认知”会导致你对“沉默证据”的忽视,所以你对该领域的认知是不完全的。

错误的归因

在【只看到】“显式样本”的情况下,你可能会产生一些错误的归因。“幸存者偏见”导致的“错误归因”会有很多种。这里仅举几个例子。

  • 因果倒置

想必大伙儿都看过举重比赛。对于举重运动员,很多人都有一个错误的观点——以为这些运动员是在练习举重之后,才导致身材变得矮壮。

但实际上捏,举重队在一开始筛选运动员的时候,就把那些身材细长的忽略掉了(这些身材细长的候选人,就是“沉默的样本”)。

换句话说,是因为他们身材矮壮,才有可能被选中去参加举重培训,而不是因为参加举重培训导致身材如此——这就是【因果倒置】。

  • 牵强的归因(无中生有)

假设某个赌徒去赌场玩“押大小”(此游戏的胜负概率皆为50%),连续赢了10次。对于大型赌场,每天来玩的人足够多,那么一段时间之后,总会出现某个赌徒玩“押大小”连续赢10次(甚至更多次)。

从概率学的角度讲,这是很普通的。但是对该赌徒而言,如果他陷入了“幸存者偏见”这个误区,他就会企图给这个现象找到一个解释(进行“归因”)。

假如此人是个宗教信徒,他/她可能会断言——有神明相助。

这就属于“牵强的归因”——把【随机事件】看作是有其它原因,并企图在随机性之外寻找一个解释。

错误的决策

还以刚才赌徒的例子来说事儿。

假设这个赌徒是宗教信徒,并且误以为自己连续赢10次是神明相助,那么他/她就会获得一种【虚假的信心】,并在这个“虚假信心”的支持下继续玩,甚至还会加大赌注/筹码。最后的结局很可能是——彻底输光。

这就是“幸存者偏见”导致的“错误决策”。


如何对付“幸存者偏见”?

在本文的最后部分,大致说一下:如何对付“幸存者偏见”?

以下几个步骤,来自于我粗糙的想法。

1. 意识到“沉默证据”的存在

这是最起码的一点——你首先要能意识到“沉默证据”的存在。

这说起来容易,做起来很难——你需要形成这样一种思维习惯:每当看到“显式的证据”,你都要在内心反问:是否存在与之对应的“隐式证据”?

2. 找到不同类型、不同层次的“沉默证据”

在前一条的基础上,你如果能找到“沉默的证据/隐式的证据”,自然就会获得更全面的认知。

有必要提醒一下:“隐式的证据”有时候不止一种类型。碰到这种情况,不是每个人都能想到所有的类型。

提到的“舆论”的例子。那些思考问题不够深入的同学,通常只意识到“网管审查/删贴”导致的“沉默证据”,而忽略了更隐蔽的“沉默证据”——那些连上网条件都没有的人,是无法在网上表达不满的。

3. 尝试排除“随机性”

决定一个样本会成为“隐式样本”or“显式样本”,有两种可能:

  • 情况A

至少有一个原因在起作用

  • 情况B

根本就【没有任何原因】(比如“抛硬币”),仅仅是随机性决定了某个样本会成为“显式” or “隐式”。对此种情况,如果你非要去找出一个原因,就会出现前面提到的“牵强的归因”。

如果你在分析某个案例时,不清楚属于上述哪一种情况,那么你需要尝试去排除“随机性”。如果无法排除,那么你就只好认可该案例是“随机性”驱动的。



————————

文章采辑于编程随想,不代表YY920|SPACE的立场

本文由curt授权YY920|SPACE发表,并经YY920|SPACE网站编辑。转载此文章须经作者同意(微信号:yuxuanke),并请附上出处(YY920|SPACE)及本页链接。