跳转至

第十二章:因果的艺术与科学(跋)

章节概述

本章是《因果关系:模型、推理与推断》一书的跋(Epilogue),改编自Pearl于1996年11月在UCLA教师研究讲座项目上发表的同名公开演讲。本章以历史脉络为主线,系统回顾了人类对因果关系认知的演变历程——从古代文明中将因果归因于神祇和拥有自由意志的人类,到中世纪机器时代物体开始获得因果特性,再到伽利略开创"描述优先于解释"的科学方法论,最终到休谟、贝叶斯、高尔顿、皮尔森、费希尔等统计学家对因果概念的复杂态度。Pearl在文中深刻指出:因果概念被排除在主流统计学之外并非偶然,而是因为概率论的官方语言无法表达因果关系。他提出因果图模型和do算子作为弥补这一缺陷的系统框架,使因果推断得以在科学的基础上进行形式化操作。本章不仅是对全书内容的总结与升华,更是一部从哲学、数学、物理学、统计学等多学科视角审视因果概念的思想史。

关键问题与研究动机

本章围绕一个核心谜题展开:为什么在科学各领域取得巨大成功的同时,"因果"概念却长期被主流统计学拒之门外?Pearl在文中提出了两个相互关联的因果谜题:

谜题一:因果知识如何获得? 休谟曾指出因果连接是观察的产物——我们通过反复观察到火焰(因)与热量(果)的恒常连接,从而学会将一方称为因、另一方称为果。然而,这个观点面临严峻挑战:公鸡的啼叫与日出也处于恒常连接之中,但我们知道前者并不导致后者;气压表的读数与下雨也是相关的,但并非因果关系。这些"伪相关"(spurious correlations)表明,单纯的规律性继承(regularity of succession)并非因果关系的充分条件。那么,究竟什么样的经验模式能够证明一个连接是因果性的?人类又是通过什么样的认知机制确信某一连接具有因果性质?

谜题二:因果知识有何实际效用? 假设我告诉你"公鸡的啼叫确实导致日出",这会让你采取什么不同的行动?Pearl以幽默的方式指出,如果公鸡打鸣真的导致太阳升起,我们可以通过提前叫醒公鸡来缩短夜晚。但这个看似简单的问题背后隐藏着深刻的哲学困境:如果因果信息确实具有超越规律性继承的经验意义,那么这种信息应该能够在物理学定律中体现出来。然而,正如伯特兰·罗素(Bertrand Russell)在1913年尖锐指出的那样,在科学的最高深领域——物理学中,"因果"一词几乎从不出现。物理学定律是对称的、可逆的,而因果关系是单向的、不可逆的。这一矛盾暴露了因果概念在现代科学框架中的尴尬地位。

Pearl进一步追溯统计学对因果概念回避的深层原因。高尔顿(Francis Galton)于1888年发现相关系数,为衡量两个变量之间的"关联"提供了一种客观的、数据驱动的测量方法。他的弟子皮尔森(Karl Pearson)将这一发现推向极致——在1911年出版的《科学语法》第三版中,皮尔森宣称:"超越物质和力这些被抛弃的基本概念之外,现代科学还有一个更加神秘莫测的偶像,那就是因果关系这一范畴。"他主张以"列联表"(contingency table)取代因果概念,认为科学描述两个事物之间关系的最终形式总可以归结为列联表。皮尔森对决定论和"意志"等拟人概念的激烈反对如此彻底,以至于他在统计学尚未扎根之前就消灭了因果关系。

费希尔(Ronald Fisher)通过提出随机化实验方法为因果关系的检验提供了一种科学证明方法,但这也是迄今为止主流统计学唯一认可的因果概念工具。这种谨慎回避的态度导致许多依赖统计学指导的领域——尤其是经济学和社会科学——陷入痼疾。Pearl指出,根本问题在于统计学的官方语言——概率论——的词汇表中根本没有"原因"这个词:我们无法用概率语言表达"泥巴不导致下雨"这样的陈述,最多只能说两者是相互关联或依赖的。

主要公式与推导

本章虽然以历史叙述和概念辨析为主,但涉及若干重要的因果推断公式。以下是本章及前后章节中出现的核心公式汇总:

公式名称 公式表达式 含义说明
牛顿第二定律 \(f = ma\) 力等于质量乘以加速度,但数学上对称可逆,无法区分因果方向
** Excess Risk Ratio(超额风险比)** \(ERR = P(Y=1 \mid do(X=1)) - P(Y=1)\) 衡量干预X=1相比自然状态对结果Y的超额风险
因果效应的后验估计 \(P(Y_y = y) = \sum_{z} P(Y=y \mid X=x, Z=z) P(Z=z)\) 给定协变量Z时,干预效果的可识别公式
强外生性假设 \(Y_x \perp\!\!\!\perp X\)\(Y_{x'} \perp\!\!\!\perp X\) 工具变量分析中的关键识别条件
弱外性假设 \(Y_x \perp\!\!\!\perp X\) 较宽松的识别条件,允许更多应用场景
似然比(用于因果归因) \(\frac{P(Y=y \mid do(X=x))}{P(Y=y \mid do(X=x'))}\) 比较两种干预下的结果概率
PNS(下限) \(\max \{0, P(y) - P(y_{x'})\}\) 使用实验与观察数据时的因果效应下界
PNS(上限) \(\min \{P(y_x), 1 - P(y_{x'})\}\) 使用实验与观察数据时的因果效应上界

核心概念澄清

相关与因果的对称性悖论:皮尔森相关系数 \(r = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y}\) 的一个关键数学性质是,绘制X对Y的回归与Y对X的回归得到相同的斜率(当标准化后)。这种对称性意味着相关关系无法区分因果方向——相关告诉我们变量如何共同变化,但不告诉我们谁导致谁变化。

do算子的引入:为克服概率语言表达因果的局限,Pearl引入了do(X=x)操作符,表示"强制将X设置为x"的干预操作。这与被动观察X=x不同——被动观察下X的分布可能受到混淆因素影响,而do操作切断所有指向X的因果路径。

关键算法与建模方法

本章虽以理论阐述为主,但涉及几种关键的因果推断方法论:

1. 因果贝叶斯网络(Causal Bayesian Networks)

因果图模型是Pearl因果推断框架的核心工具。其基本思想是用有向无环图(DAG)来表示变量间的因果结构。若图中的箭头表示直接的因果关系,则给定父节点集PA(X),节点X与其所有非后代节点在条件概率上相互独立。这一条件编码了因果马尔可夫性(causal Markov condition),是因果推断的基石。

利用因果贝叶斯网络,可以计算反事实概率 \(P(Y_y = y)\)。具体而言,在已知网络结构和条件概率表后,通过执行图手术(graph surgery)——即删除所有指向X的箭头并设置X=y——可以计算出干预分布 \(P(Y \mid do(X=y))\)

2. 工具变量法(Instrumental Variables)

当无法进行随机化实验且存在未观测混淆时,工具变量方法提供了一种识别因果效应的策略。一个有效的工具Z必须满足:(1)Z与X相关;(2)Z仅通过X对Y产生影响(排除直接效应);(3)Z与未观测混淆因子无关。通过弱外生性假设 \(Y_x \perp\!\!\!\perp Z\),可以在一定条件下识别因果效应。

3. 边界估计(Bounds Estimation)

当因果效应无法精确识别时,可以计算其上下边界。Tian等人在本书第9章和第11章中证明,在仅有观察数据或同时有实验与观察数据时,因果效应的边界可以通过线性规划方法推导出来。例如,当同时有两类数据时:

\[PNS \in \left[ \max \{0, P(y) - P(y_{x'})\}, \min \{P(y_x), 1 - P(y_{x'})\} \right]\]

这些边界在单调性假设下构成下界,且是不可改进的(sharp)。

4. 随机化实验设计(Randomized Experiments)

费希尔提出的随机化实验是因果推断的"黄金标准"。通过随机分配处理条件,可以确保处理组和对照组在所有基线特征上平衡,从而将因果效应归因于处理本身。在药物相关诉讼中,实验数据通常来自制药商或FDA批准机构,而观察数据则可通过人群随机调查获得。

主要结论

本章的核心结论可以从以下几个层面概括:

第一,因果概念的复兴具有必然性。 Pearl认为,因果关系不是也永远不会是"相关"的子集——它是一种独立的、不可约减的结构,存在于人类认知的核心位置。尽管休谟试图将因果解释为"观察的习惯",皮尔森试图以列联表取代因果概念,罗素试图将因果宣布为科学的"遗留物",但这些努力都无法阻止科学家、工程师和普通人在日常生活中使用因果推理。因果概念无法从科学话语中被彻底根除,因为它是人类理解世界的根本方式。

第二,概率论语言不足以表达因果关系。 这是本书最核心的主题之一。概率 \(P(Y \mid X)\) 和因果 \(P(Y \mid do(X))\) 是根本不同的概念——前者描述在观察到X时Y的条件概率,后者描述强制将X设置为特定值时Y的概率。当X受到混淆因素影响时,这两个量可以完全不同。因此,如果没有do算子或类似的因果操作符,我们无法用概率论语言区分"相关"与"因果"。

第三,因果图模型提供了必要的形式化框架。 Pearl提出,因果推断需要三个层次的知识:(1)关联(association)——观察条件下变量如何相关;(2)干预(intervention)——如果强制改变一个变量,其他变量如何响应;(3)反事实(counterfactual)——如果某事没有发生,结果会如何不同。这三个层次构成一个层级结构,每一层都包含下一层无法提供的信息。因果图模型和do演算使得在这三个层次上进行严格推理成为可能。

第四,从历史教训中汲取智慧。 伽利略的"描述优先于解释"原则推动了物理学的巨大进步,但当这个原则被过度推广到排除一切因果概念时,它也阻碍了统计科学的发展。Pearl认为,我们应该采纳一种更加平衡的观点:描述性定律和因果性定律各有其价值,前者预测"事物如何运行",后者解释"为什么如此运行"。两者都是完整科学理解所必需的。

挑战与开放问题

尽管Pearl的因果推断框架在过去几十年取得了重大进展,本章也揭示了该领域面临的若干重大挑战和未解决的问题:

挑战一:因果知识的获取问题。 休谟提出的第一个谜题——人类如何从经验中学习因果连接——至今仍是认知科学和人工智能领域的活跃研究方向。儿童似乎无需进行随机化实验就能习得大量因果知识,这一事实表明人类大脑可能拥有某种"因果直觉"机制。如何在计算模型中形式化这一机制仍是开放问题。

挑战二:观察研究与实验研究的结合。 在许多实际应用中,同时拥有实验数据和观察数据是可能的。Tian等人提出的边界方法虽然提供了一种整合两类数据的途径,但如何更有效地利用这种组合来缩小因果效应的估计范围仍需进一步研究。特别是在药物诉讼等高风险决策场景中,因果效应的精确识别至关重要。

挑战三:因果关系与物理定律的协调。 罗素提出的悖论——物理学定律的对称性与因果关系的非对称性之间的矛盾——仍然值得关注。尽管Pearl的框架在操作层面解决了这个问题,但在更深层次的形而上学层面,因果非对称性如何从对称的物理定律中涌现仍是一个哲学难题。

挑战四:统计学的文化变革。 将因果推断重新纳入主流统计学需要一场文化层面的变革。正如Pearl所指出的,尽管费希尔的随机化实验是统计学的伟大贡献,但统计学界对因果概念的谨慎甚至敌视态度已经持续了一个多世纪。改变这种状况需要新一代统计学家接受因果思维,而不仅仅是将其视为"应尽可能避免"或"如不可避免则需极度谨慎"的东西。

挑战五:复杂系统中的因果归因。 在具有大量变量和复杂反馈回路的系统中,因果识别和归因变得更加困难。例如,在经济系统中,政策干预的因果效应可能受到一般均衡效应的影响;在基因调控网络中,确定单个基因敲除的因果效应需要考虑整个网络的上下文。

个人反思与批判性分析

Pearl在本章的论述既有深刻的洞见,也有值得商榷的地方。以下是我对这一章的个人反思与批判性分析:

值得赞赏的方面:

首先,Pearl对统计学因果概念缺失的历史分析极具洞察力。他追溯了从伽利略到休谟、从高尔顿到皮尔森的思想脉络,揭示了因果概念被边缘化并非因为它不重要,而是因为当时缺乏表达它的形式化工具。这一历史视角帮助我们理解了为什么因果推断在20世纪大部分时间里处于统计学的边缘地带。

其次,Pearl对语言与科学进步关系的强调非常有启发性。他引用伽利略的观点——精确的正式语言是科学知识跨研究传递的必要条件——来说明为什么缺乏因果词汇阻碍了因果推断的发展。do算子和因果图模型的价值不仅在于它们提供了计算工具,更在于它们提供了描述因果关系的语言。

第三,Pearl将因果推断分为三个递进层次(关联、干预、反事实)的框架非常有意义。这一分层明确表明,许多在关联层次无法回答的问题在干预层次可以回答,而干预层次无法回答的问题在反事实层次仍有可能解决。这为因果推断提供了清晰的方法论路线图。

值得商榷或进一步思考的方面:

首先,Pearl对休谟的批评虽然精彩,但可能低估了休谟观点的深度。休谟确实面临"伪相关"问题,但他提出的"恒常连接"理论实际上包含了对因果认知的深刻洞察——即因果知识不仅来自单一观察,还来自跨情境的模式识别。现代认知科学中的因果学习理论(如概率因果模型)实际上在很大程度上延续了休谟的传统。

其次,Pearl对皮尔森的评价可能过于严苛。皮尔森对"拟人化"概念的批评——如神秘的"力"和"意志"——反映了19世纪科学唯物主义的合理诉求。虽然他将因果关系与相关混为一谈的做法确实过于极端,但他对客观测量和经验主义的强调也有其历史价值。

第三,Pearl的框架虽然强大,但在处理大规模复杂系统时可能面临计算挑战。因果图模型在变量数目巨大时可能变得难以学习和推理。尽管近年来出现了许多可扩展的方法,但将理论框架应用于"大数据"场景仍需更多研究。

第四,Pearl对物理学中因果概念的批评值得进一步探讨。尽管罗素批评物理学定律缺乏因果方向性,但现代物理学中确实存在明确的因果结构——尤其是在量子场论和热力学中。熵增定律、时间箭头等概念都与因果性有深层联系。Pearl的批评可能过于强调了经典力学的对称性,而忽视了物理学其他分支中的因果结构。

最后,从实用角度看,因果推断方法在某些领域的应用仍面临巨大障碍。例如,在社会科学中,随机化实验往往不可行,且变量的定义和测量本身就充满争议。在医学领域,伦理约束限制了某些关键实验的可行性。在这些情况下,尽管形式化框架提供了有价值的概念工具,但实际应用仍需要谨慎和智慧。

总结评价:

本章作为全书的跋,既是Pearl对因果推断领域数十年研究的总结,也是他对科学因果思维的哲学宣言。Pearl以历史为经、以思想为纬,编织出一幅从古希腊到现代统计学的因果概念演变图景。他明确指出,因果不是相关的附属品,不是统计学的禁忌词汇,而是人类理解世界的不可或缺的思维工具。因果图模型和do演算的引入标志着因果推断从"描述性艺术"向"严格科学"的转变,这一转变的重要性或许需要数十年才能被充分认识。无论读者是否完全同意Pearl的每一个论点,本章都将促使他们以新的眼光重新审视因果关系这一古老而又常新的哲学问题。