跳转至

第五章:烟雾弥漫的辩论——从观察性研究到因果关系

一、章节概述与背景

本章是《为什么》最具历史深度的一章,以1950-1960年代吸烟与肺癌之间的因果关系科学辩论为主线。Pearl回顾了统计学家和医学家在缺乏严格因果理论的情况下如何艰难地证明因果关系。核心问题是:当随机对照试验(RCT)不可行时,如何从观察性研究中推断因果关系?

开篇以Jacob Yerushalmy(烟草公司支持者)和Abe Lilienfeld(因果关系支持者)两位表兄弟的辩论为引子。Pearl指出这场辩论的本质不是关于烟草,而是关于"原因"这个词的含义。本章详细介绍了Hill准则(Hill's Criteria)的诞生过程,以及Cornfield不等式如何用数学方法驳斥"宪法假设"(存在某种基因同时导致吸烟倾向和肺癌)。最后通过"出生体重悖论"展示在没有因果图工具的情况下,流行病学家如何被对撞结构误导四十余年。


二、关键问题与研究动机

2.1 历史背景

1950-1960年代的科学家在因果推断方面"戴着枷锁跳舞"。Fisher正确推广了RCT作为评估因果效应的方法,但未能认识到观察性研究同样可以揭示因果关系——只要有正确的因果模型。这种局限使烟草公司能够利用"科学不确定性"混淆公众视听,延缓公共卫生政策确立。

2.2 五个核心科学问题

问题一:如何在RCT不可行时建立因果关系? 吸烟与肺癌案例中,进行RCT既不可行也不伦理,必须依赖观察性研究,引发了如何排除混杂因素的根本性方法论危机。

问题二:如何反驳"宪法假设"? Fisher等怀疑论者提出存在遗传或体质因素同时导致吸烟渴望和肺癌。需要证明这类混杂因素在数学上不可能完全解释所观察到的关联强度。

问题三:Hill准则的局限性是什么? 九项因果判断准则虽具常识性说服力,但每一项都有可证明的反例,且缺乏将定性标准转化为定量判断的方法论。

问题四:出生体重悖论如何产生? Yerushalmy发现的数据矛盾:吸烟母亲的低体重婴儿存活率居然高于非吸烟母亲的低体重婴儿——这似乎暗示吸烟对婴儿有保护作用,但与所有医学常识相悖。

问题五:因果语言如何影响社会政策讨论? 因果图的澄清可以帮助区分可以干预的因素(如吸烟)和无法干预的因素(如种族),使政策讨论更加理性。


三、公式推导与理论框架

3.1 Cornfield不等式(Cornfield's Inequality)

Cornfield不等式是本章最重要的数学论证。如果存在某个混杂因素Z(如吸烟基因)同时导致吸烟和肺癌,那么为了完全解释观察到的风险比,该混杂因素在吸烟者中的流行率必须远高于非吸烟者。

假设: - 吸烟者患肺癌的风险是非吸烟者的R倍(观察到的相对风险) - 混杂因素Z在非吸烟者中的流行率为\(P(Z|ar{S})\) - 混杂因素Z在吸烟者中的流行率为\(P(Z|S)\)

Cornfield不等式:

\[P(Z|S) \geq P(Z|ar{S})^{1/(R-1)} + P(Z|ar{S}) \quad \text{当 } R > 1 \qquad(5.1)\]

具体例子:如果11%的非吸烟者有"吸烟基因",那么99%的吸烟者必须拥有该基因才能完全解释关联——这在生物学上是不可能的。

3.2 案例对照研究与前瞻性研究

案例对照研究:从已知患病者和非患病者回溯暴露史。数据给出的是 \(P(\text{暴露}|\text{疾病})\),但人们想知道的是 \(P(\text{疾病}|\text{暴露})\)

前瞻性研究:从基线数据(包括吸烟状态)开始,随访多年观察结局。Doll和Hill的研究显示:重度吸烟者死于肺癌的风险是非吸烟者的24-29倍。

3.3 剂量-反应关系

如果物质A导致生物效应B,那么更大剂量的A会导致更强的响应B。吸烟量越大,肺癌风险越高,这一模式在数据中得到明显体现。


四、算法方法与实践应用

4.1 因果图的基本概念

混杂结构(Confounding):共同原因(吸烟基因)同时影响吸烟和肺癌,阻断或产生虚假的因果关联。

对撞结构(Collider):Birth Weight是吸烟和出生缺陷两个原因共同作用的结果。当条件于低出生体重婴儿时,会打开一条后门路径:

\[\text{Smoking} \rightarrow \text{Birth Weight} \leftarrow \text{Birth Defect} \rightarrow \text{Mortality}\]

4.2 敏感性分析

Cornfield的工作种下了敏感性分析的种子。这种方法不假设某些因果关系不存在,而是挑战这些假设,评估替代关系需要多强才能解释观察到的数据。

4.3 Hill准则(Hill's Criteria)

1965年Austin Bradford Hill提出九项判断因果关系的准则: 1. 一致性:多项研究在不同人群中显示相似结果 2. 关联强度:关联越强,因果可能性越大 3. 特异性:特定因素应对应特定效应 4. 时间顺序:原因必须先于结果 5. 生物梯度:剂量-反应关系 6. 合理性:与生物学知识一致 7. 连贯性:与已知事实和自然史一致 8. 实验证据:有实验室证据支持 9. 类比:类似条件下已知因果关系

每项准则都有可证明的反例,且缺乏将定性判断转化为定量结论的方法论。


五、主要结论与核心洞见

5.1 吸烟-肺癌因果关系的历史判决

经过1950-1964年间多项案例对照研究和前瞻性研究的积累,结合实验室证据,科学界最终达成共识:吸烟确实导致肺癌。1964年美国外科医生咨询委员会报告明确宣布"吸烟与男性肺癌存在因果关系"。

5.2 Cornfield不等式的历史地位

Cornfield成功地运用数学证明了:为了用宪法假设完全解释观察到的关联强度,需要假设一个在生物学上难以置信的基因-行为关联。Pearl评价这是"胚胎形态的因果论证",它种下了敏感性分析的种子。

5.3 出生体重悖论的解决

直到2006年,科学家才使用因果图工具解释了出生体重悖论。关键认识是:某些低出生体重的原因(如严重基因缺陷)比吸烟对婴儿更有害。条件于低出生体重后,吸烟变成了一种"解释效应"(explain-away effect)。

5.4 因果革命的方法论意义

Hill准则代表了从Fisher的方法论禁欲主义(假设科学家应该一无所知)到完全没有方法论的钟摆运动。因果革命在两者之间建立了桥梁:用因果图将科学家的背景知识编码进来,同时保持数学严谨性。


六、挑战与开放问题

6.1 Hill准则的固有局限

  • 一致性:如果三十项研究都忽略了同一个混杂因素,所有研究都可能是有偏的
  • 关联强度:儿童鞋码与阅读能力高度相关,但鞋码不导致阅读能力
  • 特异性:吸烟导致多种疾病——这种多效性反而削弱了特异性证据?
  • 时间顺序:公鸡打鸣总是在日出之前,但这不意味着打鸣导致日出

6.2 出生体重悖论的深层问题

Allen Wilcox提出更根本性质疑:我们如何知道低出生体重本身就是死亡的原因?即使删除低出生体重→死亡的箭头,对撞结构依然存在。这一讨论涉及种族这一敏感话题——如果低出生体重不是死亡的近因,那么针对提高出生率的公共政策可能需要重新评估。

6.3 烟草公司组织性否认主义

烟草战争是科学界第一次面对有组织的否认主义(organized denialism)。烟草公司放大了任何科学争议的细微之处,资助愿意质疑吸烟-癌症关联的科学家,延缓了公共卫生政策数十年。

6.4 Fisher角色的复杂性

Fisher坚持"谁主张谁举证"的原则,这在方法论上是合理的。但当混杂假设越来越牵强时,科学家有权做出判断。Cornfield不等式的贡献正是将这种隐含的判断转化为显式的数学约束。


七、个人反思与批判性分析

Pearl的叙事策略值得注意:他不是简单地描述因果推断的技术发展,而是通过具体的历史冲突来揭示方法论问题的重要性。这种叙事方式让读者理解为什么因果革命不是象牙塔里的数学游戏,而是有血有泪的历史斗争。

Pearl对Fisher的批评可能略显苛刻。Fisher作为统计学家,坚持"谁主张谁举证"的原则,要求在确认因果关系之前排除所有混杂解释,这在方法论上是合理的。问题在于,当混杂假设越来越牵强时,科学家有权做出判断。

尽管Pearl批评了Hill准则缺乏方法论,但这些准则在实践中仍有价值。它们代表了一种集体智慧:流行病学界是通过什么过程接受因果假设的。任何单一研究都有局限性,但当多种不同来源的证据汇聚到同一结论时,因果关系的可信度大大提高。

Pearl关于种族与出生体重的讨论揭示了科学如何与文化交织。因果图工具的价值不仅在于其技术能力,更在于它提供了一种"冷静"讨论因果问题的语言——即使在情绪激动的话题上也能保持科学客观性。

本章让我意识到,因果革命虽然强大,但并非万能解药。即使有了因果图,我们仍然需要领域知识来构建正确的图结构。因果图放大了领域知识的力量,而非替代它。


公式汇总表

编号 名称 公式 含义
(5.1) Cornfield不等式 \(P(Z\|S) \geq P(Z\|ar{S})^{1/(R-1)} + P(Z\|ar{S})\) 混杂因素在吸烟者中的流行率下限,R为相对风险
(5.2) 案例对照条件概率 \(P(\text{暴露}\|\text{疾病})\) 已知疾病状态下的暴露概率,与因果方向相反
(5.3) 前瞻性条件概率 \(P(\text{疾病}\|\text{暴露})\) 已知暴露状态下的疾病概率,直接反映因果效应
(5.4) 剂量-反应关系 \(\text{风险} = f(\text{剂量})\) 剂量增加导致风险增加的一致性模式

注:(T)=理论推导,(E)=经验公式


术语表

英文术语 中文翻译 定义
Confounding 混杂 第三个变量同时影响原因和结果,导致虚假关联或隐藏真实关联
Collider 对撞节点 两个原因共同作用的结果;条件于对撞节点会打开后门路径
Constitutional Hypothesis 宪法假设 认为存在遗传或体质因素同时导致吸烟和肺癌的假设
Sensitivity Analysis 敏感性分析 评估混杂因素需要多强才能解释观察到的关联
Hill's Criteria Hill准则 判断因果关系的九项定性准则
Case-Control Study 案例对照研究 从已知疾病状态回溯暴露史的观察性研究
Prospective Study 前瞻性研究 从基线暴露状态随访观察结局的前瞻性研究
Dose-Response Effect 剂量-反应效应 更大剂量的暴露导致更强生物效应的模式
Back-Door Path 后门路径 连接原因和结果但箭头方向不对的伪因果路径
Collider Bias 对撞偏差 条件于对撞节点时产生的虚假关联