第 2 章 数学预备知识(Some Mathematical Preliminaries)
作者
Bernt Øksendal(奥斯陆大学)。本章无单独作者署名,由全书作者本人撰写。Øksendal 在本章以"快速回顾 + 关键例证"的方式,把后续 10 章需要用到的全部概率论工具——概率空间、随机变量、独立性、随机过程、布朗运动——重新陈述一遍。这种"工具集"章节在数学教材中通常要么极简(让读者去翻 Williams/Karatzas)、要么极详(自成一个 mini 教材),Øksendal 走了中间路线:给出严格定义和关键定理,对证明只给思路,最关键的几个(如 Kolmogorov 连续性、Brownian 构造)用 Brownian motion 作为"motivation"完整推导一遍。
内容概述
本章为后续 10 章搭建严格概率论框架,是"工具章"。
本章中心任务:把 Ch 1 用直觉语言描述的 7 个 Problem 中的"随机量"——噪声项 \(dB_t\)、观测 \(Z_t\)、状态 \(X_t\)——翻译成严格的数学对象,并给出后续会反复调用的最关键的几个定理。
主要内容: 1. 概率空间 \((\Omega, \mathcal F, P)\):\(\mathcal F\) 是 \(\sigma\)-代数(Def 2.1.1),\(P\) 是完备概率测度。 2. 随机变量 \(X: \Omega \to \mathbb R^n\):\(\mathcal F\)-可测函数;诱导分布 \(\mu_X(B) = P(X^{-1}(B))\)。 3. Doob-Dynkin 引理 2.1.2:\(Y\) 关于 \(X\) 生成的 \(\sigma\)-代数可测当且仅当 \(Y = g(X)\)。这是后续"条件期望"和"基于 \(\sigma\)-代数的估计"(Ch 6 Kalman-Bucy)的引理基础。 4. \(L^p\) 空间:\(L^2\) 是 Hilbert 空间,内积 \(\langle X, Y\rangle = E[XY]\)。\(L^2\) 完备性(即将在 Ch 3 用来定义 Itô 积分的等距同构)。 5. 独立性(Def 2.1.3)。 6. 随机过程(Def 2.1.4):\(\{X_t\}_{t\in T}\) 是参数化随机变量族;强调 \((t,\omega) \mapsto X_t(\omega)\) 的联合可测性。 7. Kolmogorov 扩张定理 2.1.5:给定兼容的有限维分布族 \(\nu_{t_1,\ldots,t_k}\),可构造概率空间与过程具有这些分布。这是"任意随机过程的存在性"的基础定理。 8. Brownian motion(Def 2.2.1):用 Gaussian heat kernel \(p(t,x,y) = (2\pi t)^{-n/2} e^{-|x-y|^2/2t}\) 显式构造;建立基本性质:\(E[B_t] = x\),\(E[(B_t-x)^2] = nt\),独立增量。 9. Kolmogorov 连续性定理 2.2.3:用 \(E[|X_t - X_s|^\alpha] \le D|t-s|^{1+\beta}\) 条件可构造连续版本;对 BM 取 \(\alpha=4, \beta=1\)(因 \(E[|B_t-B_s|^4] = n(n+2)|t-s|^2\))。
关键预览(为后续章节铺垫):Exercise 2.17 证明 Brownian motion 的二次变差 \(= t\) a.s.,且总变差 \(=\infty\) a.s.——这正是 Ch 3 Itô 积分 \(\int H\,dB\) 不是 Riemann-Stieltjes 积分的根因,也正是 Itô 公式 \(d(B_t^2) = 2B_t\,dB_t + dt\) 中"\(\tfrac12 dt\)"修正项的来源。
在全书中位置:工具章。Ch 3–Ch 12 所有"严格"推导都基于本章定义。本章不需要 Itô 积分知识,但后面的 Ch 3–Ch 12 都需要本章的 Doob-Dynkin 引理、Kolmogorov 定理、Brownian motion 三大块。
前置知识:本科测度论(\(\sigma\)-代数、Lebesgue 积分、\(L^p\) 空间完备性)、本科概率论(期望、方差、独立性、特征函数)。若读者无测度论背景,建议先读 Williams (1991)《Probability with Martingales》前 4 章。
核心方程与概念
本章理论密度高、定义多,是全书"概念密度"的峰值章节。下面按"定义—定理—概念"的逻辑分组列出最重要的 8 个对象。
2.1 概率空间三元组(Def 2.1.1)
- \(\sigma\)-代数三公理:(i) \(\emptyset \in \mathcal F\),(ii) \(A \in \mathcal F \Rightarrow A^c \in \mathcal F\),(iii) \(\sigma\)-可数并封闭。
- 完备性(completeness):\(\mathcal F\) 包含所有 \(P\)-外测度为 0 的集。本书假设所有概率空间完备——这条假设把"零测集上的任意函数都自动 \(\mathcal F\)-可测",简化后续所有条件期望的定义。
2.2 随机变量与分布
分布 \(\mu_X(B) := P(X^{-1}(B))\),期望 \(E[X] = \int_\Omega X\,dP = \int_{\mathbb R^n} x\,d\mu_X(x)\),\(E[f(X)] = \int_{\mathbb R^n} f\,d\mu_X\)。
2.3 Doob-Dynkin 引理(Lemma 2.1.2)— Ch 6 的引理基础
- \(\mathcal H^X := \sigma(X) = \{X^{-1}(B): B \in \mathcal B(\mathbb R^n)\}\) 是 \(X\) 生成的最小 \(\sigma\)-代数。
- 意义:Ch 6 滤波问题中,最优估计 \(\hat X_t = E[X_t \mid \mathcal F^Z_t]\) 是 \(\mathcal F^Z_t\)-可测随机变量;Doob-Dynkin 引理保证 \(\hat X_t = g_t(\{Z_s: s\le t\})\)——即估计是观测历史的确定性函数,这正是 Kalman-Bucy 滤波能写成 ODE 的根本原因。
2.4 \(L^p\) 空间与 Hilbert 结构
\(L^2(P)\) 是 Hilbert 空间,内积 \(\langle X, Y\rangle_{L^2} = E[XY]\)。
- \(L^2\) 完备性(即 Riesz-Fischer 定理)是 Ch 3 Itô 积分定义的关键:\(L^2\) 是完备的,因此可定义等距映射 \(I: \mathcal V \to L^2\),\(\mathcal V\) 是简单过程类(再闭化到 \(L^2\) 等价类)。
2.5 独立性(Def 2.1.3)
推广:\(\{X_i\}_{i\in I}\) 独立 \(\iff\) 它们生成的 \(\sigma\)-代数 \(\mathcal H^{X_i}\) 独立。
- 关键事实(Exercise 2.5):若 \(X, Y\) 独立且 \(E[|X|], E[|Y|] < \infty\),则 \(E[XY] = E[X]E[Y]\)。
- 本书使用模式:Ch 3 中布朗运动 \(B_t\) 的独立增量性质 + \(L^2\) 正交性 = Itô 等距;Ch 6 中信号噪声 \(B_t\) 与观测噪声 \(\tilde B_t\) 独立;Ch 8 中 Girsanov 变换(与独立 \(\sigma\)-代数的正交分解)。
2.6 随机过程(Def 2.1.4)
两种观点: 1. 固定 \(t\):\(X_t(\omega)\) 是随机变量("看横向切片")。 2. 固定 \(\omega\):\(t \mapsto X_t(\omega)\) 是路径("看纵向切片","particle \(\omega\) 在时刻 \(t\) 的位置")。
强调 \((t,\omega) \mapsto X_t(\omega)\) 联合可测——这在 Ch 3 Itô 积分的 Fubini 类论证中是关键技术条件。
2.7 Kolmogorov 扩张定理(Thm 2.1.5)
- (K1):\(\nu_{t_{\sigma(1)},\ldots,t_{\sigma(k)}}(F_1 \times \cdots \times F_k) = \nu_{t_1,\ldots,t_k}(F_{\sigma^{-1}(1)} \times \cdots \times F_{\sigma^{-1}(k)})\)。
- (K2):\(\nu_{t_1,\ldots,t_k}(F_1 \times \cdots \times F_k) = \nu_{t_1,\ldots,t_{k+m}}(F_1 \times \cdots \times F_k \times \mathbb R^n \times \cdots \times \mathbb R^n)\)。
- 意义:从此"任意指定兼容的有限维分布"就存在实现的过程——Brownian motion 的存在性就是直接应用此定理。
2.8 Brownian Motion 的构造(Def 2.2.1)— 全书主角
- 用 \(p\) 构造兼容的有限维分布族:对 \(0 \le t_1 \le \cdots \le t_k\),
这本质上是 "Markov 核的卷积结构"——每个增量 \(B_{t_{i+1}} - B_{t_i}\) 是均值为 0、方差为 \(n(t_{i+1}-t_i)\) 的正态,与 \(X\) 独立——这是 Ch 5 Itô SDE \(dX_t = b\,dt + \sigma\,dB_t\) 显式解的概率结构。
基本性质:
独立增量:\(B_{t_1}, B_{t_2} - B_{t_1}, \ldots, B_{t_k} - B_{t_{k-1}}\) 独立。
2.9 Kolmogorov 连续性定理(Thm 2.2.3)— 关键工具
对 BM:\(E[|B_t - B_s|^4] = n(n+2)|t-s|^2\),故 \(\alpha=4, \beta=1, D=n(n+2)\),可选取连续版本。
- 关键洞察:这里 \(\alpha, \beta\) 满足 \(\alpha > 2(1+\beta)/\beta\)(实际上是 \(\alpha = 4 > 2(1+1)/1 = 4\) 取等),给出 Hölder 连续指数 \(\gamma = (\alpha-1-\beta)/\alpha = (4-1-1)/4 = 1/2\)——故 BM 路径是 a.s. \(\gamma\)-Hölder 对任意 \(\gamma < 1/2\)(但不是 \(1/2\)-Hölder)。
- 后续使用:Ch 7 证明扩散的强 Markov 性需要路径右连续左极限存在(càdlàg),而 BM 路径连续(比 càdlàg 强),所以扩散可在 BM 的驱动下逐点分析。
2.10 二次变差 = t(Exercise 2.17 预览)
且 \(\langle B\rangle^{(1)}_t = \infty\) a.s. ——BM 无界变差。
- 意义:Itô 积分 \(\int_0^t H_s\,dB_s\) 的定义必须用 \(L^2\) 等距(利用 \(\sum H^2 \Delta t\) 收敛到 \(\int H^2\,ds\)),不能用 Riemann-Stieltjes 定义(后者要求被积函数有界变差)。
- Itô 公式 \(d(B_t^2) = 2B_t\,dB_t + dt\) 中的 "\(+dt\)" 项正是此 \(\langle B\rangle_t = t\) 的微元形式。
关键结论
- 概率空间是所有随机分析的"舞台"。一旦固定 \((\Omega, \mathcal F, P)\),所有随机变量、过程、期望、条件期望都是相对于 \(\mathcal F\) 和 \(P\) 的对象。本书的 \(\mathcal F\) 总是完备的——这条假设在 Ch 3–Ch 8 的等距论证中避免了测度论技术细节。
- Doob-Dynkin 引理是条件期望"可计算性"的基础。Ch 6 滤波中 \(E[X_t \mid \mathcal F^Z_s] = g(Z_{s_1}, \ldots, Z_{s_k})\),这正是 Kalman-Bucy 滤波器能写成确定性 ODE 的根据。少了这个引理,Ch 6 寸步难行。
- Kolmogorov 扩张定理是"任意随机过程的存在性保证"。理论上给定任一族兼容的有限维分布,都可构造实现它的概率空间与过程——这一看似抽象的结果是 Brownian motion 构造、Lévy 过程构造、随机域构造的统一基础。
- Brownian motion 是"高斯-独立增量-连续"三位一体的唯一对象。三性质合一方有非平凡样本路径;缺一就退化为更简单的过程(白噪声、退化过程、Poisson 过程)。
- Kolmogorov 连续性定理的微妙之处:用四阶矩条件 \(\alpha=4\) 得到 \(\gamma=1/2\)-Hölder(实际只对 \(\gamma<1/2\) 成立),这个 "比预期低 1/2 阶" 正是 Itô 微分比 Riemann 微分 "奇异" 的根源。Ch 3 Itô 公式的 \(\tfrac12 \sigma^2 \partial_{xx}\) 项正是这种 \(\gamma=1/2\) 路径粗糙性的代数反映。
- Brownian motion 二次变差 \(= t\) 是 Itô 积分的"度量"。对确定性的 \(f\) 而言,\(\int_0^t f(B_s)\,dB_s\) 是关于 \(L^2\) 范数收敛的鞅——Ch 3 Itô 等距 \(\| \int_0^t H\,dB\|_2^2 = E[\int_0^t H_s^2\,ds]\) 就是用 \(\langle B\rangle_t = t\) 作 "长度度量" 推出来的。
- 第 2 章的"\(\sigma\)-代数精细结构"贯穿全书。Ch 6 滤波中 \(\mathcal F^Z_t\)(观测历史)与 \(\mathcal F^B_t\)(噪声历史)的独立性;Ch 7 强 Markov 性中 \(\mathcal F_{T+}\) 的一致可测性;Ch 8 Girsanov 变换中 \(\mathcal F_t\) 的完备化——所有这些都依赖本章的 \(\sigma\)-代数基础。
挑战和开放性问题
- Kolmogorov 扩张定理的"非唯一性":给定一族兼容的有限维分布,可构造多个不同过程实现这些分布(Def 2.2.2 "version")。本书假设可"自由选择"对所有应用方便的版本,但对具体应用(如数值模拟),选择哪一版对算法效率有显著影响——这点 Ch 12 数值定价并未详述。
- Kolmogorov 连续性定理中的 \(\alpha, \beta\) 选取:本书用 \(\alpha=4\) 是因为 BM 矩容易算。但对其他过程(如 Lévy 过程没有有限阶矩),连续性 / 右连续性的证明需要 Lévy-Itô 分解,本书 Ch 8 仅简述。
- Doob-Dynkin 引理的"非显式函数 \(g\)"问题:引理保证 \(g\) 存在但不给出构造。对连续随机变量 Radon-Nikodym 定理给出 \(g\) 的积分表示;对一般情形需要 \(\mathcal L^2\) 投影的存在性证明——本书直接用 \(L^2\) 完备性回避。
- Brownian motion 在 \(n=1\) 维以外的几何特殊性:\(n \ge 2\) 时 BM 是递归(recurrent)的(任意开集被无穷次访问),\(n=3\) 时 BM 是逃逸(transient)的(很快离开任何紧集)。这一拓扑差异在 Ch 7 扩散的稳定性、Ch 9 Dirichlet 边值问题中起决定作用——本书 Ch 7-9 会隐式用到但没有强调"\(n=1\) vs \(n=2\) vs \(n \ge 3\)"的几何分类。
- 二次变差 \(= t\) 的"非光滑性"如何精确化:Exercise 2.17 只证了二次变差的 \(L^2\) 收敛,未证 a.s. 收敛(需 Lévy 给出的鞅收敛 + Kolmogorov 0-1 律)。对工程应用,"二次变差是鞅"的事实比"二次变差等于 \(t\)"更关键,但本书把这一论证推迟到 Ch 3 鞅论部分。
- 完备化 (completeness) 假设的代价:所有概率空间都假设完备(Ch 2 末尾)简化了条件期望定义,但隐藏了"为什么 \(\Omega\) 上有那么多零测集"的几何直觉。在金融应用中,完备化常常让条件期望的"几何解释"(如 Merton 问题的对偶状态)变得不够透明。
个人反思与批判性分析
本章是全书的"地图颜色"——它给每一个后续对象(鞅、Itô 积分、扩散、鞅表示、鞅问题)一个清晰的"在概率论谱系中位于何处"的标记。读后续章节时如果觉得"突然出现一个新概念",回头查本章对应的 \(\sigma\)-代数 / 期望 / 独立性定义,几乎都能找到根源。
Doob-Dynkin 引理被严重低估——Ch 2.1.2 只用了 3 行证明,但在 Ch 6(Kalman-Bucy 滤波器写成 ODE)、Ch 8(Girsanov 变换中 \(\mathcal F^B\) 可测过程的 \(\mathcal L^2\) 投影)、Ch 11(HJB 解是 \(\mathcal H^X\)-可测的)都反复被调用。如果第一次读到没太在意,建议重读时在引理旁标注"它将用于 Ch X.Y"。
Brownian motion 构造的"数学严密性 vs 应用直觉"的张力——本章用 Kolmogorov 扩张定理 + heat kernel 严格构造了 BM,但在应用上我们更愿意把 BM 想象成"真实物理过程"(Ch 1.1 Robert Brown 观察的"花粉颗粒运动")。两种观点不能完全兼容:物理 BM 路径几乎处处不可微(这一点 Ch 3 Itô 微分会让我们痛苦地接受),但物理学家直觉上认为"任何连续运动都有瞬时速度"。这是 Itô SDE vs Stratonovich SDE 区别的物理根源,Ch 5 / Ch 8 会深入讨论。
Kolmogorov 连续性定理的"工程意义"——表面看它是纯分析工具("四阶矩控制 → 连续版本"),但工程意义在于:BM 路径的 \(\gamma=1/2\)-Hölder 性是所有"BM 驱动的数值算法"的精度上界。Ch 12 模拟 BM 时,用 Euler-Maruyama 取 \(\Delta t = 2^{-k}\) 步长,得到的强误差 \(\|X_T - X_T^{(\Delta t)}\|_2 = O(\Delta t^{1/2})\)——这个 \(1/2\) 次方正是路径粗糙度 \(\gamma=1/2\) 的直接体现。
与同类教材比较——相比 Karatzas & Shreve (1998)《Brownian Motion and Stochastic Calculus》的 Ch 1-2,Øksendal 的本章更应用导向:直接用 BM 构造作为例子把所有概念串起来(其他教材常常把 BM 构造放在 Ch 2 末或 Ch 3);相比 Shreve (2004)《Stochastic Calculus for Finance I》的 Ch 1-2,本章有更严格的 \(\sigma\)-代数和 \(L^p\) 论述(Shreve 假设读者已知测度论)。结论:有测度论背景的研究者可直接从本章入手;无测度论背景但目标在金融的读者建议先读 Williams (1991) Ch 1-4 或 Shreve (2004) Ch 1-2。
对初学者的建议——本章的习题是真正理解后续章节的"门槛":Exercise 2.6 Borel-Cantelli 引理(Ch 3 Itô 积分零集讨论)、Exercise 2.8 BM 矩的计算(Ch 3 Itô 等距验证)、Exercise 2.17 二次变差 \(=t\)(Ch 3 Itô 公式的"几何原因")是三个最关键的。如果只想做一遍,下一轮读书时请把这三题亲手算一遍再继续 Ch 3。
重要参考文献
注:Ch 2 是工具章,原始引用较少;以下列本章明确引用 + 后续章节反复调用的经典来源。
[X1] D. Williams. Probability with Martingales. Cambridge University Press, 1991. ISBN 978-0521406055. — 本章推荐的概率论快速参考。Doob-Dynkin 引理、Borel-Cantelli、鞅收敛定理均能找到严格证明。
[X2] M. M. Rao. Probability Measures with Given Marginals and Conditional Probabilities. The Annals of Probability 12(2): 367–376, 1984. — Doob-Dynkin 引理一般化形式来源(Prop. 3, p. 7)。
[X3] A. N. Kolmogorov. Foundations of the Theory of Probability (original: Grundbegriffe der Wahrscheinlichkeitsrechnung, 1933). English translation: Chelsea, 1956. — 现代概率论公理化基础,扩张定理的原始论文。
[X4] A. N. Kolmogorov. On the continuity of conditional Markov processes (Russian). Izvestiya Akad. Nauk SSSR. Ser. Mat. 1: 1–10, 1937. — Kolmogorov 连续性定理的原始论文。
[X5] D. W. Stroock, S. R. S. Varadhan. Multidimensional Diffusion Processes. Springer Grundlehren 233, 1979. ISBN 978-3540902983. — 本章反复引用的"进一步阅读",BM 路径的 Polish 空间结构、连续性定理证明均在此。
[X6] O. Kallenberg. Foundations of Modern Probability, 2nd ed. Springer, 2002. ISBN 978-0387953137. — 现代概率论参考书,Kolmogorov 定理的最新形式(Thm 3.23)。
[X7] P. Lévy. Processus stochastiques et mouvement brownien. Gauthier-Villars, 1948. — 二次变差 \(\langle B\rangle_t = t\) 几乎必然成立的原始论证(Lévy 连续模定理)。
[X8] R. Brown. A brief account of microscopical observations made in the months of June, July, and August, 1827, on the particles contained in the pollen of plants. Philosophical Magazine 4: 161–173, 1828. — BM 物理起源的历史论文("Brownian motion" 名称的来源)。
[X9] S. Kakutani. On Brownian motions in n-space. Proceedings of the Imperial Academy of Tokyo 20: 648–652, 1944. — 多维 BM 递归 / 逃逸性(recurrent / transient)的首次分析(Ch 7 / Ch 9 用到)。
[X10] D. Revuz, M. Yor. Continuous Martingales and Brownian Motion, 3rd ed. Springer Grundlehren 293, 1999. ISBN 978-3540643253. — 本书 Ch 3–Ch 8 所有鞅论 / BM 性质的"完整百科"。