文章目录[隐藏]
在公共卫生建议方面,我们很难追寻我们应该相信什么。 我们曾被告知,维生素 C、E 和 β-胡萝卜素抗氧化剂可降低患心脏病的几率,多吃纤维可预防结肠癌。 我们曾被告知要少吃粗粮,几十年后又被告知要多吃粗粮。 我记得有一段时间,健康通讯告诉我限制饮食中鸡蛋的数量。 与此同时,它还建议每天喝一杯葡萄酒,因为葡萄酒中的抗氧化剂对结肠癌有保健作用。 最近,这些建议变成了可怕的警告,哪怕只喝一杯葡萄酒。
这是怎么回事呢?
这些建议是基于一些精明的小规模观察,而其他旨在复制研究的建议却无法证实结果。 一项涉及数万名试验和对照对象的临床研究无法证实任何假设,但这并不意味着一个事件会导致另一个事件。 它所能做的只是提供一种假设正确的可能性。 充其量,它只是提供了一个事件导致另一个事件的间接证据。 在不确定原因的情况下,我们对如何提出具体建议知之甚少。 事实上,如果原因是错误的,建议可能弊大于利。
在提出建议时,我们不需要知道原因。 我们只需要知道一些因果关系。 例如,我们确实知道吸烟与肺癌和心血管疾病有某种因果关系,尽管我们不知道而且可能永远也不会知道真正的原因。 二战期间,数百万美国妇女加入劳动大军,并首次开始吸烟。 欧洲有数百万人在战斗中受伤或丧生,后来,当吸烟可能导致肺癌的警告出现时,数百万人得救了。
经常会有混淆不清的情况,让我们认为一件事是另一件事的原因:当 A 间接导致 B 时,因为 A 导致 C,而 C 恰好导致 B。 此外,讨厌的隐藏变量也会欺骗我们。 因此,我们看到的原因要么是不存在的,要么是太难找到的。
虚幻的相关性来自于我们看待和呈现数据的方式
如果我们天真地收集学生的成绩和头发长度,比如数学课,我们就有可能看到头发长度和成绩之间的直接关系。 头发长的人可能成绩好。 如果不考虑第三个变量,我们可能会从这种相关性中得出结论:学生应该留长头发,以便在那门课上取得好成绩。 这是因为忽略了第三个变量,比如年龄或性别。 头发长度可能偏向于年龄较大的学生,而他们的头发恰好较长,或者偏向于头发比男性长的女性。
隐藏变量在统计数据相关性中无处不在。 如果没有发现这些变量,我们必然会误信各种无稽之谈,比如要想在大学取得好成绩,就应该开始吸烟,因为 “吸烟者的大学成绩比不吸烟者高”。
听从建议
如果公众听从来自临床研究的健康建议,我们就会学到一些东西。 假设我们指责吸烟是肺癌和心血管疾病的罪魁祸首是错误的。 如果是这样的话,我们就不应该看到肺癌和心血管疾病的发病率在过去近 60 年里急剧下降,在此期间,美国的吸烟人口下降了 57%。
自然界中的事件取决于许多变量,以至于精确测量往往是不可能的。 如果一个简单的事件,比如掷硬币,取决于在电子意外碰撞的轻微混沌世界中发生的无数无法检测的事件,那么试想一下,癌症这种复杂的现象是由无数的事件造成的。
等等,现在。 发现癌症的病因,并不等于就能很好地猜出疑点是什么。 一些科学家将二战后工业化国家肺癌发病率的上升归因于职业因素和新的工业产品。 由于美国和欧洲的道路建设激增,沥青受到怀疑。 然而,到了 1950 年底,随着大量研究将吸烟与肺癌联系起来,吸烟显然是一个巨大的因素。 统计学的工作不是寻找原因,而是寻找嫌疑人。 许多无法用规律解释或无法用观察测量的自然关系,都可以通过猜测原因的统计测量联系起来。 一些公共卫生建议可能就是这样: 猜测。
All animals are basically information transformers. Brains crave change in information flow, and this is largely driven by sensati…