第五章：社会科学与经济学中的因果性与结构模型

章节概述

第五章以Pearl 2009年专著《Causality》的核心论题——结构方程模型（SEM）在社会科学与经济学中的因果解释问题——展开深入分析。本章系统性地回答了困扰学界数十年的根本问题：结构方程中的系数究竟意味着什么？为何其因果含义在现代文献中被严重误解甚至刻意回避？Pearl从历史脉络出发，指出SEM的创始者Wright（1921）和Haavelmo（1943）从未怀疑过结构系数的因果解释——在他们看来，方程$y = \beta x + e$中的$\beta$正是X对Y的因果效应度量。然而，自1980年代起，由于缺乏恰当的数学符号表示因果假设，SEM的因果语义逐渐被代数语言所淹没，导致当代研究者（包括Bollen、Holland等权威）对结构系数产生了深重的困惑。

本章的核心贡献在于：第一，通过d-分离准则将因果图与统计检验直接联系起来；第二，通过"单门准则"（Single-Door Criterion）和"后门准则"（Back-Door Criterion）分别解决直接效应和总效应的可识别性问题；第三，给出了结构方程、结构参数和误差项的操作性定义，将SEM从纯代数对象重新确立为因果推理的正式语言；最后，系统阐述了外生性（exogeneity）的图论解释与其在政策评估中的含义。全章贯穿一个核心信念：图是表达因果假设的最佳数学语言，它使隐含的因果前提变得透明、可检验。

关键问题与研究动机

5.1.1 为何因果性需要自己的语言？

概率论的标准数学语言无法区分"泥巴不导致雨"（因果关系不存在）与"泥巴与雨相互独立"（统计独立性）这两个本质不同的陈述。标准概率论只能表达变量间的统计相关性或条件独立性，而无法表达"X导致Y"这一非对称因果关系。这一困境迫使科学家在概率论之外引入因果词汇，而历史上两套主要的因果形式化体系——Wright的路径分析/结构方程建模（SEM）和Neyman-Rubin的潜在结果模型——虽然数学上等价（见第七章第7.4.4节），却都未能在各自领域成为标准方法。前者因"严重滥用且形式化不足"而受质疑，后者因依赖随机实验和反事实变量的深奥认识论而难以被广泛接受。Pearl称之为"科学史上最奇特的循环之一"：因果性在寻找语言，而该语言的使用者却在寻找其意义。

5.1.2 SEM的语义是如何被遮蔽的？

SEM的衰落有其深层历史原因。Wright（1923）明确声明"路径系数理论以因果关系的先验知识为前提"；Haavelmo（1943）将每个结构方程解释为关于虚拟控制实验的陈述。这些创始者理解结构方程中的等号传达的是"由……决定"这一非对称关系，更接近编程语言中的赋值符号（:=）而非代数等号。然而，他们未能引入专门符号来表示这种非对称性。

Pearl指出了SEM语义遮蔽的两大主因：第一，SEM实践者为了获得统计学界的认可，刻意将因果假设隐含化，因为统计学家厌恶无法直接检验的假设；第二，代数语言本身缺乏将因果假设与统计假设明确区分开来的符号设施。当1980年代这些创始者的弟子将等号误读为代数等号时，"干扰项"（disturbance terms）突然变得无法理解——Richard（1980，第3页）称之为"所谓干扰项毫无意义"。这一历史教训深刻说明：未能用数学符号表达洞察，就等于将洞察交给了遗忘。

5.1.3 图作为数学语言的优势

图论方法的引入为SEM注入了新的解释力。图不仅仅是展示代数关系的启发式工具（如Blalock和Duncan所采用的），而是提供了一套基本符号系统，用于表达在标准代数方程和概率演算中难以形式化的概念和关系。Pearl以Simpson悖论为例说明：尽管这个悖论已有一百多年的研究历史，但"应该使用调整前还是调整后的关联"这一实际问题始终未得到正式解答——原因是Simpson悖论的解决依赖于无法用标准统计语言形式化表达的因果假设。相比之下，将协变量选择问题用图语言形式化，立即得到了一般性的形式解：通过后门准则（定义3.3.1），研究者只需在路径图中检查d-分离关系，就能判断某一调整是否适合评估总效应或直接效应。

主要公式与推导

5.2.1 可检验含义与d-分离

结构方程的一般形式（非参数）： $$x_i = f_i(pai, e_i), \quad i = 1, \ldots, n \qquad(5.1)$$

线性结构方程（参数形式）： $$x_i = \sum_{k \notin i} \alpha_{ik} x_k + e_i, \quad i = 1, \ldots, n \qquad(5.2)$$

d-分离定理（定理5.2.1）： 若在DAG图G中，集合X和Y被Z d-分离，则在依据G构造的任何Markovian模型中，X条件独立于Y（给定Z）。逆命题亦成立：若X和Y在G中不被Z d-分离，则在几乎所有依据G构造的Markovian模型中，X和Y条件相关。

推论5.2.2： 在任何依据DAG G构造的Markovian模型中，只要Z对应的节点集合将X节点与Y节点d-分离，偏相关系数$r_{XY \cdot Z}$必为零，且该零值对所有模型参数均成立；此外，没有任何其他偏相关系数会对所有参数都为零。

定理5.2.3（一般线性模型中的d-分离）： 对于依据包含环路和双向弧的图D构造的任何线性模型，双向弧$i \leftrightarrow j$被解释为潜在共同父节点$i \leftarrow L \rightarrow j$。当且仅当节点集合Z d-分离X和Y时，偏相关系数$\rho_{XY \cdot Z}$为零。

5.2.2 测试基础（Basis）

定义5.2.4（基）： 设S为一组偏相关系数集合。B是S的一个基，当且仅当：（i）B蕴含（利用概率律）S中每个元素的零值；（ii）B的任何真子集都不能维持这种蕴含关系。

定理5.2.5（图的基）： 对于DAG D中任意非相邻节点对$(i, j)$，设$Z_{ij}$为任意接近$i$而不接近$j$的节点集合，且$Z_{ij}$ d-分离$i$和$j$。则集合$B = \{r_{ij \cdot Z_{ij}} = 0 \mid i \neq j\}$（每对非相邻节点一个元素）构成D所蕴含的全部零偏相关系数的基。

对于图5.1中的模型，以下两个集合均构成基： $$B_1 = \{r_{32\cdot1} = 0, r_{41\cdot3} = 0, r_{42\cdot3} = 0, r_{51\cdot43} = 0, r_{52\cdot43} = 0\}$$ $$B_2 = \{r_{32\cdot1} = 0, r_{41\cdot3} = 0, r_{42\cdot1} = 0, r_{51\cdot3} = 0, r_{52\cdot1} = 0\} \qquad(5.3)$$

关键洞察： 每个基元素对应图中一条缺失的边；因此，验证一个DAG所需的测试数量等于图中缺失边的数量。稀疏图的约束更强，需要更多测试来验证这些约束。

5.3.1 参数可识别性

单门准则（定理5.3.1）： 设$G$为包含链接$X \rightarrow Y$（系数为$\alpha$）的路径图，$G_\alpha$为删除$X \rightarrow Y$后的图。若存在变量集$Z$满足：（i）$Z$不含$Y$的任何后裔；（ii）$Z$在$G_\alpha$中d-分离$X$和$Y$，则$\alpha$可识别且等于偏回归系数$r_{YX \cdot Z}$。反之，若$Z$不满足上述条件，则$r_{YX \cdot Z}$不是$\alpha$的一致估计量（除参数空间中的零测度集外）。

后门准则（定理5.3.2）： 对于因果图G中任意两个变量X和Y，X对Y的总效应可识别当且仅当存在测量集Z满足：（1）Z中任何变量都不是X的后裔；（2）Z在子图$G_{\underline{X}}$（删除从X发出的所有箭头后的子图）中d-分离X和Y。若两条件满足，则总效应为$r_{YX \cdot Z}$。

工具变量公式： 在图5.9中，$\alpha$不可直接识别，但通过工具变量Z可解出： $$\alpha = \frac{r_{YZ}}{r_{XZ}} \qquad(5.11)$$

这是Bowden和Turkington（1984）工具变量公式的图论推导。

5.3.3 结构性因果效应的干预解释

控制期望（do算子）： $$E[Y \mid do(x)] \triangleq E[Y \mid do(X = x)] \qquad(5.19)$$

观测期望（标准条件期望）： $$E[Y \mid x] \triangleq E[Y \mid X = x] \qquad(5.20)$$

两者一般不等。以模型（5.7）—（5.9）为例： $$E[Y \mid do(x)] = \beta\alpha x \quad \text{但} \quad E[Y \mid x] = r_{YX \cdot Z} x = (\beta\alpha + \gamma) x$$

结构性方程的威力在于：它不仅编码初始平衡状态，还编码了确定哪些方程必须被打破以适应新平衡状态所需的信息。

5.4.1 操作性定义

结构方程（定义5.4.1）： 称方程$y = \beta x + e$是结构性的，其解释为：在理想实验中，我们将X控制到$x$并将其他变量集Z（不含X或Y）控制到$z$时，Y的值由$\beta x + e$给出，其中$e$不是设置$x$和$z$的函数。

结构参数的操作性定义： $$\beta \triangleq \frac{\partial E[Y \mid do(x)]}{\partial x} \qquad(5.24)$$

此定义不依赖于观察数据中$e$和$X$是否相关——无论是否存在通过另一方程$x = \gamma y + \delta$产生的相关，定义始终成立。

误差项的操作性定义： $$\epsilon_Y \triangleq Y - E[Y \mid do(x)] \qquad(5.25)$$

这一定义将误差项从形而上学的迷雾中解放出来：它测量的是Y与其控制期望的偏离，而非与其条件期望的偏离；其统计特性可以在获得结构系数后从观察研究中估计出来。

不变性声明（结构方程的核心经验主张）： $$P(y \mid do(x), do(z)) = P(y \mid do(x)) \qquad(5.23)$$

即在do(x)条件下，Y的统计量应对Z的干预保持不变。这正是结构方程区别于回归方程的本质所在。

5.4.4 外生性（Exogeneity）

一般外生性定义（定义5.4.5）： 设X和Y为两组变量，设$\lambda$为依据理论T在结构模型M上定义的任意参数集。若对满足T的任意两个模型$M_1$和$M_2$： $$P_{M_1}(y \mid x) = P_{M_2}(y \mid x) \implies \lambda(M_1) = \lambda(M_2) \qquad(5.31)$$ 则称X相对于$(Y, \lambda, T)$是外生的。

无混杂条件（强外生性特例）： $$P(y \mid do(x)) = P(y \mid x) \qquad(5.30)$$

此即"无后门路径"条件——通过定理5.3.2可在图上直接检验。

误差相关性的可检验性： $$E[Y \mid x, do(s_{XY})] = E[Y \mid do(x), do(s_{XY})] \qquad(5.27)$$

关键算法与建模方法

1. 模型测试：缺失边法

Wright的方法本质上是将相关系数分解为沿路径的路径系数乘积之和。图形方法将这一过程完全图化：给定一个DAG，识别所有非相邻节点对，对每对应用d-分离测试，该测试给出的零偏相关约束构成模型的可检验含义。测试一个Markovian线性模型只需测试其基中的零约束。

Shipley（1997）实现了这些测试。关键在于，基中的约束数量等于图中缺失边数量，测试是局部性的——每个测试只涉及对应缺失边所关联的变量，不受模型其他部分测量误差的污染。这比传统的两步最大似然估计+全局拟合度测试更为可靠。

2. 模型可识别性分析：系统化五步程序

Pearl给出了在图中识别可计算系数的系统化程序：

在图中寻找可识别的因果效应（使用后门准则和单门准则），包括直接效应、总效应和部分中介效应；
将涉及的路径系数放入"桶"中；
对桶中的系数进行标注：（a）若桶为单元素，标注为I（可识别）；（b）若桶含唯一未标注元素，也标注为I；
重复直至无新标注产生；
列出所有已标注系数。

为增强能力，可加入规则3*：若存在至多$k$个含至多$k$个未标注系数的非冗余桶，同时标注这些系数。进一步可利用Wright规则列出涉及双向弧的相关表达式。

3. 模型等价类构造

定理5.2.6： 两个Markovian线性正态模型观测等价当且仅当它们蕴含相同的零偏相关系数集合；且两个这样的模型观测等价当且仅当其对应图具有相同的边集和相同的y-结构。

这一定理将模型测试问题转化为纯图论问题。对于半Markovian模型，d-分离仍是独立性的必要检验，但零偏相关等价不再意味着观测等价（因为可能存在不同的不等式约束）。

边替换规则（半Markovian模型）： - 规则1：箭头$X \to Y$可与双向弧$X \leftrightarrow Y$互换，当且仅当X的每个邻居或父节点都与Y不可分； - 规则2：箭头$X \to Y$可反转成$Y \to X$，当且仅当反转前：（i）Y的每个邻居或父节点（除X外）都与X不可分；（ii）X的每个邻居或父节点都与Y不可分。

4. 协变量选择与回归量确定

图形方法为"哪些回归量是允许的"这一长期困扰研究者的问题提供了统一解答。核心原则： - 后门路径阻断：协变量必须阻断X和Y之间的所有非因果（混淆）路径； - 不能是中介变量：不能调整受X影响的变量（即X的后裔），因为那会阻断部分因果效应； - 判断标准：d-分离检验——若Z d-分离X和Y（在后门子图中），则Z是合法的调整集。

5. 干预效果计算的非参方法

给定因果图G，do(x)的效应计算遵循算法：删除所有指向X的箭头（体现"干预"意味着替换X的生成方程），然后在修改后的图中计算条件概率$P(y \mid x)$。图形方法无需知道函数形式即可完成这一计算（第三章第3.3.2节），这正是非参数识别的核心所在。

主要结论

5.2 关于模型测试

SEM不能测试因果模型，只能测试其零假设：结构性方程模型只能检验由d-分离准则揭示的零偏相关约束。这些约束只是整个因果模型所代表的claims、assumptions和implications中的一小部分。SEM失败时，研究者几乎得不到关于"哪个建模假设错误"的指导。
缺失边提供了系统化的局部测试：传统全局拟合度测试无法隔离模型不拟合的真正来源。相比之下，每个缺失边对应一个局部测试，可独立验证而不受无关测量误差污染。这构成了一种更可靠的模型调试方法。
等价模型的存在是逻辑必然：由于因果关系不能从统计数据中单独推断，等价模型的存在是不可避免的（正如Wright 1921年所述："因果关系的先验知识是SEM的前提"）。这并不使SEM无用——它只是提醒我们：SEM测试的从来不是"哪个因果模型正确"，而是"给定先验因果知识，数据是否兼容"。

5.3 关于可识别性

总效应与直接效应的识别条件已被图论彻底解决：单门准则（定理5.3.1）给出了直接效应可识别的充要条件；后门准则（定理5.3.2）给出了总效应可识别的充要条件。这些条件在非线性、非高斯模型和离散变量模型中同样成立。
有些效应可以整体识别，即便其组分不可识别：图5.8中的总效应$\alpha + \beta\gamma$可直接从数据识别（$r_{YX \cdot Z_2}$），尽管组分$\alpha$和$\beta\gamma$各自不可识别。这说明传统SEM方法（聚焦于逐个参数的识别和估计）可能遗漏这类可识别的效应。
协方差等价不意味着因果等价：模型$M$（方程5.7—5.9）和模型$M'$（方程5.12—5.14）对观察变量X、Y、Z产生相同的协方差矩阵，但对do(X = x)的干预效应给出不同预测：$E[Y \mid do(x)] = \beta\alpha x$对$\beta'\alpha' + \delta)x$。这是结构性解释区别于纯代数解释的关键所在。

5.4 关于概念基础

结构系数的操作性含义：$\beta$是控制期望相对于X的一阶偏导，即$\beta = \partial E[Y \mid do(x)] / \partial x$。它与回归系数$r_{YX}$一般不同——后者在存在后门路径时混淆了因果效应和选择偏差。
误差项的操作性含义：$\epsilon_Y = Y - E[Y \mid do(x)]$测量Y与其控制期望的偏离。这一误差与回归误差$Y - E[Y \mid x]$本质不同——前者对干预不变，后者受混淆影响。
不变性是结构方程的核心：结构方程的真正力量在于其不变性声明（公式5.23）：当X被干预控制时，Y的分布对其他变量的干预保持不变。这种不变性使SEM成为政策评估的形式基础。
外生性的图论定义统一了弱外生性、强外生性和超外生性：通过将外生性定义为"从条件分布可识别参数"，Pearl将统计外生性（弱外生）和因果外生性（超外生）纳入统一框架，并给出了在后门子图上通过d-分离检验外生性的直接方法。
双向弧应默认存在：由于我们永远无法穷尽所有可能影响变量的因素，正确的默认假设应该是任意两节点间存在潜在共同影响（双向弧）。只有当有充分实质理由（如已知不存在共同原因，或已知不存在选择偏差）时才删除双向弧。

挑战与开放问题

1. 非线性模型的参数计数问题

本章主要处理线性模型。对于一般非线性结构方程，d-分离准则仍然有效，但参数可识别性的代数分析变得极为复杂。虽然非参数识别问题原则上已由第十二章的方法解决，但实用中"给定一个非线性SEM，如何系统地判断某个参数是否可识别"仍缺乏像定理5.3.1那样简洁的图论准则。

2. 半Markovian模型中等价类的完整描述

d-分离等价对于半Markovian模型只是观测等价的必要条件，而非充分条件。完全描述半Markovian模型的等价类需要考虑由双向弧引入的不等式约束。Spirtes和Verma（1992）给出了d-分离等价的充要判据，但完整且实用的等价类构造方法仍不完善。

3. 误差相关性的实质判断

虽然公式（5.27）给出了检验误差相关性的操作性标准——比较$E[Y \mid x, do(s_{XY})]$与$E[Y \mid do(x), do(s_{XY})]$——但在实践中，$s_{XY}$涉及所有其他变量的复杂实验条件，这种评估在认知上不可行。研究者不得不依赖"遗漏因素"（omitted factors）的概念性判断，但Pearl也承认这种判断"在认知上可控因为是定性的，只依赖纯粹的结构知识"。然而，在复杂的因果网络（如社会经济系统）中，"是否存在同时影响多个变量的未观测因素"这一判断本身可能极不可靠。

4. 因果效应与统计效应的持续混淆

尽管Pearl提供了清晰的概念区分——$E[Y \mid do(x)]$（因果）与$E[Y \mid x]$（统计）——但在应用研究中，将统计关联误读为因果效应的倾向仍然普遍。这不仅是知识问题，更涉及学术激励结构：政策制定者往往寻求简单的因果结论，而研究者面临发表"因果发现"的压力。

5. 动态效应（Indirect Effects）的操作性定义

间接效应的定义（4.14节）依赖于嵌套反事实，在非线性系统中尤为复杂。虽然Pearl给出了线性系统中间接效应的简洁操作定义（"在X保持不变时，将中介变量Z提高到X单位变化所能达到的值，Y的增量变化"），但如何在离散或非线性系统中实施这一测量，仍是未解难题。

6. Lucas批判与结构不变性

Lucas（1976）批判指出，经济主体会预期政策干预并采取相反行动，这导致基于历史数据估计的结构参数在政策应用时失效。Pearl承认这一批判"只是将模型的不变性和结构建模的负担从行为层面转移到更深层——涉及主体动机和预期的层面"，但未给出如何处理此类预期效应的系统方法。这是因果图方法在宏观经济政策评估中面临的核心挑战。

个人反思与批判性分析

从代数迷雾到图论清晰：一场认知革命

Pearl在本章中的写作带有强烈的"拨乱反正"色彩。他对SEM历史中创始者真知灼见被遗忘的惋惜，以及对当代权威学者（包括Holland、Bollen、Hendry等）概念混淆的批评，都体现出一位理论家面对知识退化的紧迫感。我认为这种紧迫感是正当的——因为一旦我们将结构方程$y = \beta x + e$仅理解为"描述$Y$在给定$X$下的条件分布的简写"，我们就失去了整个因果推理的形式基础，而这种损失在政策评估中可能是致命的。

对"图即语义"论点的深度认同

Pearl的核心主张——图不仅仅是启发式工具，而是因果语义的正式载体——在阅读本章后显得极为有说服力。尤其是定理5.2.1（d-分离与条件独立的对应）和定理5.3.1（单门准则）展示了如何通过纯图论操作读取因果假设、检验含义和判断可识别性。这与Wright（1921）的愿景——"因果关系的先验知识是SEM的前提"——完美契合：图正是这种先验知识的精确表达形式。

对工具变量公式图论推导的欣赏

第五章从图5.9推导出$\alpha = r_{YZ} / r_{XZ}$（即工具变量公式）的过程令人印象深刻。这一推导完全避开了传统计量经济学对"相关性"和"内生性"的复杂讨论，仅通过检查图中的d-分离关系就确立了识别条件。这表明图论方法不仅更直观，而且在某些情况下比传统代数方法更简洁有力。

对"外生性"讨论的批评性审视

Pearl将外生性定义为"从条件分布可识别参数"（公式5.31），并声称这统一了弱外生性、强外生性和超外生性。然而，我注意到这一定义高度依赖于"理论T"——即背景因果假设的集合。如果研究者对T的设定不同，同一变量可能获得不同的外生性身份。这意味着外生性不是变量的内在属性，而是相对于特定因果模型的相对属性。Pearl似乎也承认这一点（第1530页注20），但这是否意味着在实际应用中，外生性判断最终仍然依赖于研究者对因果结构的先验信念？这值得进一步追问。

对"双向弧默认存在"原则的实践考量

Pearl建议默认在任意两节点间添加双向弧，只在有充分实质理由时才删除。这一原则在理论上无懈可击——它等价于承认我们的知识永远是不完整的。但在实践中，对于有数十个变量的复杂社会系统，如果默认添加所有$\binom{n}{2}$个双向弧，不仅可识别性会急剧下降，模型也变得完全不可检验。这暴露了因果发现方法在应用中的一个根本张力：理论上要求谨慎，实践中要求简约。

对"SEM无用论"回应的评价

Pearl对"等价模型存在故SEM是伪科学"这一论点的回应（5.2.3节最后一脚）非常精彩。他指出：即使存在27个等价模型（以Bagozzi-Burnkrant模型为例），发现AFFECT对BEHAVIOR的影响几乎三倍于COGNITION对BEHAVIOR的影响，仍然具有重大政策意义。这提醒我们：定量分析的价值不依赖于单一最优模型的唯一确定，而依赖于揭示不同因果结构下的不同定量预测，从而为政策辩论提供更透明的信息基础。

一个未被充分解决的张力

我认为本章最大的未竟之事是：Pearl一方面坚持因果假设必须来自先验知识或实验设计（图是这些假设的表达），另一方面又不断强调图方法可以"揭示"因果结构——如从缺失边推导出可检验含义。这两者之间存在微妙但重要的区别：若图本身就是因果知识的来源（而不仅仅是表达），则d-分离分析可能在循环论证；若图只是已有因果知识的表达，则"从图中读取可识别性"只是将已有知识形式化，而非发现新知识。Pearl在这个问题上基本上采取了前者立场（尤其是关于后门准则的政策应用），这可能是整个因果发现范式中最需要进一步辩护的哲学预设。

公式汇总表

编号	公式名称	公式	适用场景
(5.1)	非参数结构方程	$x_i = f_i(pai, e_i)$	因果模型一般形式
(5.2)	线性结构方程	$x_i = \sum_{k \notin i} \alpha_{ik} x_k + e_i$	参数化因果模型
(5.23)	结构方程不变性声明	$P(y \mid do(x), do(z)) = P(y \mid do(x))$	区分结构方程与回归方程
(5.24)	结构参数操作性定义	$\beta \triangleq \frac{\partial E[Y \mid do(x)]}{\partial x}$	路径系数的因果含义
(5.25)	结构性误差操作性定义	$\epsilon_Y \triangleq Y - E[Y \mid do(x)]$	误差项的因果含义
(5.26)	误差协方差可检验性	$E[e_Y e_X] = E[YX \mid do(pa_Y, pa_X)] - E[Y \mid do(pa_Y)]E[X \mid do(pa_X)]$	判断误差独立性
(5.27)	误差独立性的可操作检验	$E[Y \mid x, do(s_{XY})] = E[Y \mid do(x), do(s_{XY})]$	实际判断误差相关性
(5.30)	无混杂条件（强外生性）	$P(y \mid do(x)) = P(y \mid x)$	后门路径不存在时
(5.31)	一般外生性定义	$P_{M_1}(y \mid x) = P_{M_2}(y \mid x) \implies \lambda(M_1) = \lambda(M_2)$	参数从条件分布识别
定理5.2.1	d-分离定理	X⊥Y \| Z（当Z d-分离X和Y）	Markovian模型的概率约束
定理5.2.5	图的基定理	$B = \{r_{ij \cdot Z_{ij}} = 0\}$ 构成零偏相关的基	模型测试的最小约束集
定理5.3.1	单门准则	$\alpha = r_{YX \cdot Z}$ 当Z阻断$G_\alpha$中所有X-Y路径	直接效应识别
定理5.3.2	后门准则	总效应$= r_{YX \cdot Z}$ 当Z无后裔且d-分离X、Y	总效应识别
工具变量	IV公式	$\alpha = r_{YZ} / r_{XZ}$	从r-Z识别X对Y的因果效应

笔记基于 Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press. Chapter 5.

编号	公式名称	公式	适用场景
(5.1)	非参数结构方程	\(x_i = f_i(pai, e_i)\)	因果模型一般形式
(5.2)	线性结构方程	\(x_i = \sum_{k \notin i} \alpha_{ik} x_k + e_i\)	参数化因果模型
(5.23)	结构方程不变性声明	\(P(y \mid do(x), do(z)) = P(y \mid do(x))\)	区分结构方程与回归方程
(5.24)	结构参数操作性定义	\(\beta \triangleq \frac{\partial E[Y \mid do(x)]}{\partial x}\)	路径系数的因果含义
(5.25)	结构性误差操作性定义	\(\epsilon_Y \triangleq Y - E[Y \mid do(x)]\)	误差项的因果含义
(5.26)	误差协方差可检验性	\(E[e_Y e_X] = E[YX \mid do(pa_Y, pa_X)] - E[Y \mid do(pa_Y)]E[X \mid do(pa_X)]\)	判断误差独立性
(5.27)	误差独立性的可操作检验	\(E[Y \mid x, do(s_{XY})] = E[Y \mid do(x), do(s_{XY})]\)	实际判断误差相关性
(5.30)	无混杂条件（强外生性）	\(P(y \mid do(x)) = P(y \mid x)\)	后门路径不存在时
(5.31)	一般外生性定义	\(P_{M_1}(y \mid x) = P_{M_2}(y \mid x) \implies \lambda(M_1) = \lambda(M_2)\)	参数从条件分布识别
定理5.2.1	d-分离定理	X⊥Y \| Z（当Z d-分离X和Y）	Markovian模型的概率约束
定理5.2.5	图的基定理	\(B = \{r_{ij \cdot Z_{ij}} = 0\}\) 构成零偏相关的基	模型测试的最小约束集
定理5.3.1	单门准则	\(\alpha = r_{YX \cdot Z}\) 当Z阻断\(G_\alpha\)中所有X-Y路径	直接效应识别
定理5.3.2	后门准则	总效应\(= r_{YX \cdot Z}\) 当Z无后裔且d-分离X、Y	总效应识别
工具变量	IV公式	\(\alpha = r_{YZ} / r_{XZ}\)	从r-Z识别X对Y的因果效应