第 10 章 最优停时的应用(Application to Optimal Stopping)
作者
Bernt Øksendal(奥斯陆大学)。本章是 Ch 1 Problem 5 的解——找到最优停售资产的时间 \(\tau^*\),最大化期望折现收益。
最优停时理论是 20 世纪概率论的重大应用之一。Snell 1952 给出"最小上鞅"理论、Dynkin 1963 给出"最小 superharmonic majorant"理论、Shiryaev 1978 给出"阈值策略"理论。本章综合这些工具,给出"扩散的最优停时"完整理论。
核心思想:最优停时问题 = "在扩散的所有停时中找期望收益最大的"。关键工具是"最小 superharmonic majorant" \(\hat g\)——它既是 \(g\) 的"保守上界",又是"扩散期望的结构性约束"。最优收益 \(g^* = \hat g\),最优停时 \(\tau^* = \tau_D\)(首次离开"继续区域" \(D = \{g < g^*\}\) 的时间)。
内容概述
本章正式"回答" Ch 1 提出的 Problem 5:最优停售资产的时间。
本章中心任务:给定 Itô 扩散 \(X_t\) 和收益函数 \(g\),求 \(\tau^* = \arg\sup_\tau E^x[g(X_\tau)]\)。
主要内容: 1. 最优停时问题定义(Def 10.1.1):\(g^*(x) = \sup_\tau E^x[g(X_\tau)]\),求 \(\tau^*\)。 2. 超均值(supermeanvalued)与超调和(superharmonic)函数(Def 10.1.2, 10.1.4, Lem 10.1.3):\(f(x) \ge E^x[f(X_\tau)]\) 对所有停时 \(\tau\)。 3. 过度函数(excessive function)(Def 10.1.5, Thm 10.1.6):\(f(x) \ge E^x[f(X_s)]\) 对所有 \(s \ge 0\)——与超调和等价。 4. 最小 superharmonic majorant \(\hat g\)(Thm 10.1.7, Cor 10.1.8):\(g_n(x) = \sup_{t \in S_n} E^x[g_{n-1}(X_t)]\) 的归纳构造;\(g_n \uparrow \hat g\)。 5. 最优停时存在性(Thm 10.1.9): - (a) 价值函数 = \(\hat g\):\(g^* = \hat g\)。 - (b) \(\epsilon\)-最优策略:\(D_\epsilon = \{g < \hat g - \epsilon\}\),\(\tau_\epsilon = \tau_{D_\epsilon}\) 使 \(|g^* - E[g(X_{\tau_\epsilon})]| \le \epsilon\)。 - (c-d) 真正最优策略:在"继续区域" \(D = \{g < g^*\}\) 上继续,在 \(\partial D\) 停。 6. 最优停时唯一性(Thm 10.1.12):如果存在 \(\tau^*\),则 \(\tau^* \ge \tau_D\) 且 \(\tau_D\) 也是最优。 7. 例子(10.1.13-10.1.14):\(n = 2\) BM(递推 + 唯一 superharmonic = 常数 → \(g^* = \sup g\));\(n = 3\) BM(superharmonic = \(|x|^{-1}\) 等 → 立即停为最优)。 8. 时变情形(Ch 10.2-10.3):\(g^*(s, x) = \sup_\tau E^{(s,x)}[g(s+\tau, X_\tau)]\)。 9. 带积分收益(Eq 10.1.5):\(G^*(s, x) = \sup_\tau E[\int_0^\tau f(s+t, X_t) dt + g(s+\tau, X_\tau)]\)。 10. 变分不等式表述(Ch 10.4):\(g^*\) 是 \(\max\{Lg - \partial_t g, g - G\} = 0\) 的解(\(L\) 是 \(X\) 的生成元)。
在全书中位置:应用章。Ch 10 是 Ch 1 Problem 5 的解。综合 Ch 7(生成元 + Dynkin)+ Ch 8(Feynman-Kac)+ Ch 9(边值问题)的工具。
前置知识:Ch 7-9 全部。最优停时理论是 Itô 理论对"决策问题"的应用——比 PDE 边值问题多了一个"自由边界"(continuation region 的边界)。
核心方程与概念
本章是"应用章"——综合 Ch 7-9 工具。下面列出最重要的 11 个对象。
10.1 最优停时问题(Def 10.1.1)
- 假设:\(g \ge 0\) 连续(推广到 \(g\) 下半连续、\(g\) 有下界)。
- 直观:在游戏中可随时停 → \(g(X_t)\) 是收益 → 选最优停时 \(\tau^*\) 最大化期望。
- Ch 1 Problem 5 实例:\(X_t\) = 资产价格,\(g = e^{-\rho \tau} X_\tau\)(折现收益),\(\tau^*\) = 最优停售时间。
10.2 超均值 + 超调和函数(Def 10.1.2, 10.1.4, Lem 10.1.3)
超均值:\(f(x) \ge E^x[f(X_\tau)]\) 对所有停时 \(\tau\)。
超调和:\(f\) 超均值 + 下半连续。
性质(Lem 10.1.3): - (a) \(\alpha f\) 超均值 if \(f\) 超均值 - (b) \(f_1 + f_2\) 超均值 if \(f_1, f_2\) 超均值 - (c) \(\inf_j f_j\) 超均值 if \(\{f_j\}\) 超均值 - (d) \(f_k \uparrow f\) 逐点 → \(f\) 超均值 - (e) \(f\) 超均值 + \(\sigma \le \tau\) 停时 → \(E^x[f(X_\sigma)] \ge E^x[f(X_\tau)]\) - (f) \(f\) 超均值 + Borel \(H\) → \(E^x[f(X_{\tau_H})]\) 超均值
- 核心洞察(Remark 10.1.3-2):\(f \in C^2\) 超调和 \(\iff\) \(Af \le 0\)(\(A\) 是 \(X\) 的生成元)。这是 PDE 不等式的概率版。
- Ch 9 联系:超调和 = 经典 PDE \(\Delta u \le 0\) 的概率版。
- Ch 10 联系:最优停时值 \(g^*\) 是 \(g\) 的"最小 superharmonic majorant" \(\hat g\)——既超调和又 \(\ge g\)。
10.3 过度函数(Def 10.1.5, Thm 10.1.6)
过度函数:\(f(x) \ge E^x[f(X_s)]\) 对所有 \(s \ge 0\)。
Thm 10.1.6:\(f\) 过度 \(\iff\) \(f\) 超调和。
- 关键洞察:超均值 = "对所有停时"的条件期望下界;过度 = "对所有确定时间 \(s\)"的条件期望下界。两者等价——停时可以比确定时间更灵活,但结论相同。
- 意义:过度条件更易验证(只需对 \(s\) 验证),但等价于超均值(适用于所有停时)。
10.4 最小 superharmonic majorant \(\hat g\)(Thm 10.1.7, Cor 10.1.8)
构造(Thm 10.1.7):取 \(g_0 = g\),\(g_n(x) = \sup_{t \in S_n} E^x[g_{n-1}(X_t)]\),\(S_n = \{k \cdot 2^{-n}: 0 \le k \le 4^n\}\)。则 \(g_n \uparrow \hat g\)(最小 superharmonic majorant)。
Cor 10.1.8:可取 \(S_n = [0, \infty)\):\(h_n(x) = \sup_{t \ge 0} E^x[h_{n-1}(X_t)]\) → \(\hat g\)。
- 关键洞察:\(\hat g\) 是 \(g\) 的"最小上界"——既超调和又 \(\ge g\)。
- 算法(Thm 10.1.7 归纳):
- \(g_0 = g\)(原始收益)
- \(g_1(x) = \sup_t E^x[g(X_t)]\)(单步最优)
- \(g_2(x) = \sup_t E^x[g_1(X_t)]\)(两步最优)
- ...
- \(g_n \to \hat g\)(无穷步最优 = 最优值)
10.5 最优停时存在性(Thm 10.1.9)
(a) 价值函数:\(g^*(x) = \hat g(x)\)(最小 superharmonic majorant = 最优期望收益)。
(b) \(\epsilon\)-最优策略:\(D_\epsilon = \{x: g(x) < \hat g(x) - \epsilon\}\),\(\tau_\epsilon = \tau_{D_\epsilon}\)。则 \(|g^*(x) - E^x[g(X_{\tau_\epsilon})]| \le \epsilon\)。
(c) 真正最优策略:继续区域 \(D = \{x: g(x) < g^*(x)\}\),停时 \(\sigma_N = \tau_{D_N}\),\(D_N = \{x: g_N(x) < \hat g_N(x)\}\),\(g_N = g \wedge N\)。当 \(\tau_D < \infty\) a.s. + \(\{g(X_{\sigma_N})\}_{N}\) 一致可积 → \(g^*(x) = \lim_N E^x[g(X_{\sigma_N})]\)。
(d) 最优停时:\(\tau^* = \tau_D\)(首次离开 \(D\) 的时间)。
- 核心结论:最优停时 \(\tau^* = \tau_D\) = 首次离开继续区域 \(D\) 的时间。这是 Snell 1952 鞅论 + Dynkin 1963 调和论的结合。
- 几何意义:继续区域 \(D\) 是"还没停下的"区域——在 \(D\) 内部,\(g < g^*\)(继续更好);在 \(\partial D\),\(g = g^*\)(停时收益 = 继续期望)。
10.6 最优停时唯一性(Thm 10.1.12)
如果存在最优 \(\tau^*\),则 \(\tau^* \ge \tau_D\)(任何最优策略都不早于 \(\tau_D\) 停),且 \(\tau_D\) 本身也是最优。
- 意义:最优停时不必唯一——任何 \(\tau^* \ge \tau_D\) 都是最优(在 \(\partial D\) 上 \(\tau^*\) 的具体取值不影响 \(g^*\))。
- 典型例子:当 \(D\) 内部有"无差别区域"(\(g = g^*\) 的内部点)时,\(\tau^*\) 在此区域可任意停留。
10.7 关键观察 \(U \subset D\)(Remark 10.1.12)
设 \(U = \{x: Ag(x) > 0\}\)。则 \(U \subset D\)(继续区域)。
- 物理意义:在 \(Ag > 0\) 的区域,\(g\) 的"瞬时增长率"为正 → 继续比立即停更优。
- 典型情况:\(U \ne D\)——\(D\) 中存在 \(Ag \le 0\) 的"非典型继续区域"(典型情形)。
10.8 例子 10.1.13(2 维 BM)
\(n = 2\) BM 是递推的。任何非负超调和函数都是常数(Ex 10.2)。故 $\(g^*(x) = \|g\|_\infty = \sup_y g(y).\)$
- 应用:如果 \(g\) 无界 → \(g^* = \infty\),无最优停时。如果 \(g\) 有界:
- 若 \(\partial D\) 极集(容量 0)→ \(\tau_D = \infty\) a.s. → 无最优停时
-
若 \(\partial D\) 非极集 → \(\tau_D < \infty\) a.s.,\(\tau_D\) 是最优
-
意义:2 维 BM 上任何 \(g^*\) 等于全局上确界——"迟早会访问到 \(g\) 的最大值"。
10.9 例子 10.1.14(3 维 BM)
\(n = 3\) BM 是逃逸的。\(g(\xi) = |\xi|^{-1}\) for \(|\xi| \ge 1\), \(g(\xi) = 1\) for \(|\xi| < 1\)。\(g\) 本身超调和(\(-\Delta g = 0\) in \(|\xi| > 1\))→ \(g^* = g\) → 立即停为最优。
- 几何意义:3 维 BM 远离原点 → \(g\) 衰减到 0 → 立即停收益最大。
- 对比 2 维:2 维 BM 反复回原点 → 期望 \(g\) 在 1 处最大 → 必然访问到。
10.10 时变情形(Ch 10.2)
把 \(s\) 加到状态 \(Y_t = (s + t, X_t)\),\(Y\) 是齐次扩散,\(g\) 提升为 \(\tilde g(t, x) = g(s + t, x)\),问题化归到 Ch 10.1。
- 应用:当 \(g\) 显式依赖时间(如 \(g(s, x) = e^{-\rho s} x\) for 折现收益)时必用。
- 生成元:\(A = \partial_s + L_{X}\)(抛物算子)。
10.11 变分不等式(Ch 10.4)
\(g^*\) 满足 $\(\max\{L g^* - \partial_t g^*, g^* - g\} = 0 \text{ in } D, \quad g^* = g \text{ on } \partial D.\)$
- 解析等价(自由边界问题):
- 在 \(D\) 内:\(L g^* - \partial_t g^* = 0\)(继续 → PDE 方程)
- 在 \(D^c\) 内:\(g^* = g\)(停时 → 直接等于 \(g\))
- 在 \(\partial D\)(自由边界):\(g^* = g\) + 适当光滑条件("价值匹配" + "高阶光滑")。
- 数值算法:有限差分 + 投影迭代(Longstaff-Schwartz 2001 用蒙特卡洛)。
关键结论
- \(g^* = \hat g\)(最小 superharmonic majorant = 最优期望收益)——Thm 10.1.9 的核心。
- \(\tau^* = \tau_D\)(继续区域 \(D\) 的首次离开时间)= 最优停时。任何不早于 \(\tau_D\) 停的策略都是最优(Thm 10.1.12)。
- 继续区域 \(D\) 由 PDE 不等式决定:\(U = \{Ag > 0\} \subset D\)。
- 2 维 BM 上 \(g^* = \|g\|_\infty\)(递推性 → 必然访问到最大值)。
- 3 维 BM 上 \(g\) 本身超调和 → 立即停为最优(逃逸性 → 远离最大值区域)。
- 变分不等式是自由边界问题的 PDE 等价:\(\max\{Lg - \partial_t g, g - G\} = 0\) in \(D\), \(g = g\) on \(\partial D\)。
- 归纳构造(Thm 10.1.7)\(g_n(x) = \sup_t E^x[g_{n-1}(X_t)] \uparrow \hat g\) 是Snell 鞅的概率版——\(g_n\) 是 \(g\) 的"n 步最优"近似。
- Ch 10 是 Ch 9 边值问题 + 自由边界的综合——Ch 9 解的是固定边界问题;Ch 10 解的是自由边界问题(continuation region 的边界是未知的,必须由"价值匹配" + "高阶光滑"条件确定)。
挑战和开放性问题
- 自由边界的"正则性":变分不等式中 \(\partial D\)(自由边界)的光滑性只有部分结果(\(C^{1,\alpha}\) 对 \(\Delta u = 0\) in \(D\), \(u = g\) on \(\partial D\) 的 \(g\) 强光滑时)。真实应用中 \(g\) 经常不光滑(如 \((x - K)^+\) 在 \(K\) 不可微)——需要 Tanaka 公式 + local time 理论。
- 一致可积条件:Thm 10.1.9c 要求 \(\{g(X_{\sigma_N})\}\) 一致可积。在 \(g\) 无界或停时可能无穷时,验证此条件非平凡。
- 不连续 \(g\) 的扩展:Thm 10.1.9 要求 \(g\) 连续。当 \(g\) 是 barrier option 的 payoff(如 \(\mathbf 1_{S > K}\))时,\(g\) 只能 Borel 可测——理论需推广。
- 多维问题的"数值计算":高维 \(X_t\) 下,\(\hat g\) 的数值计算(通过归纳 \(g_n\))是 \(O(N^d \cdot T/\Delta t)\) 计算量——长尺度 PDE 数值方法(Penalty, BMO, Dupire)成为主流。
- 不规则扩散:Ch 10 主要对 \(X\) 是连续 Itô 扩散。跳扩散(如 Heston 随机波动率带跳)需要不同的边界处理。
- 可积收益(Eq 10.1.5):\(G^*(s, x) = \sup_\tau E[\int_0^\tau f dt + g]\) 的可微性 + 变分不等式是当前研究热点。
- 反射边界 / 吸收边界:当 \(X\) 在 \(\partial U\) 上有特殊行为(反射/吸收)时,最优停时问题需要边界条件特殊处理(Kushner 1972)。
- 平均场最优停时(Carmona-Fouque 2014):当 \(X\) 的动力学依赖其他"agent"的最优决策时(\(X_t\) 是 \(\sigma\)-Martingale),单 agent 最优停时理论需要扩展。
个人反思与批判性分析
本章是 Itô 理论对"决策科学"的胜利——把"何时停"这种纯直觉问题严格化为 \(\tau_D\)(首次离开继续区域的时间)。
Snell 鞅的本质:\(M_t = g^*(X_t)\)(最优价值的过程版本)是 \(\mathcal F_t\)-鞅——\(E[M_T \mid \mathcal F_t] = M_t\)。这是"无套利"在停时决策中的体现——任何能"改进"的最优策略必能"对冲"。
继续区域 \(D\) 的"非平凡"性质:\(D\) 通常不是 PDE 解直接决定的——它是"问题自身"决定的自由边界。这是 PDE 边值问题中"自由边界问题"的本质(Stefan 问题、障碍问题都属于此类)。
Ch 1 Problem 5 的"古典"实例:\(X_t\) = 资产价格 SDE,\(g(x) = e^{-\rho t} x\) → 折现收益。最优停时 \(\tau^*\) 通常是"first passage time":当 \(X_t\) 达到某个阈值 \(K^*\) 时停。确定 \(K^*\) 是热方程 PDE 的解(Ch 10.4 末例子给出"American option" 的 \(K^*\))。
2 维 vs 3 维 BM 的对比是"递推 vs 逃逸"对最优停时影响的经典例证——这反映了几何对决策的根本影响。
对应用研究的意义: - 金融工程:American option 定价 = 几何 BM + 最优停时 PDE。 - 能源工程:石油开采的最优停采 = OU 过程 + 最优停时(Ch 1 Problem 5 的应用)。 - 生物:物种灭绝的最优时间(gene drive 控制)。 - 医学:药物试验的最优停药时间(生存分析)。
与 Shreve (2004)《Stochastic Calculus for Finance II》的比较——Shreve Ch 8 给出 American option 定价的 PDE 推导(变分不等式),但缺少Snell 鞅理论的系统论述。Øksendal 的版本是最优停时理论的"严格数学版"。
与 Karatzas-Shreve (1998) Ch 4 的比较——KS 给出了一般 Markov 过程的最优停时理论(Ocone 1984 的内蕴方程),但偏重抽象。Øksendal 的 Itô 扩散版本对工程读者更友好。
对初学者的建议——本章的 Exercise 10.1(5 个具体的最优停时问题)、Exercise 10.2(2 维 BM superharmonic = 常数)、Exercise 10.3(几何 BM 最优停售)是 Ch 12 American option 定价的"前身"。亲手做完后,Ch 12 几乎不需要重读 Snell 鞅。
重要参考文献
[X1] J. L. Snell. Applications of martingale system theorems. Transactions of the American Mathematical Society 73: 293–312, 1952. — Snell 鞅(最小上鞅)的原始论文(Thm 10.1.9 引用)。
[X2] E. B. Dynkin. The optimum choice of the stopping moment for a Markov process. Theory of Probability and Its Applications 9: 612–614, 1963. — Dynkin "最小 superharmonic majorant" 理论(Thm 10.1.7 引用)。
[X3] A. N. Shiryaev. Optimal Stopping Rules. Springer, 1978. ISBN 978-0387021160. — 阈值策略理论 + 经典最优停时教科书。
[X4] E. B. Dynkin. Markov Processes, Vol. I–II. Springer, 1965. ISBN 978-3540036221. — 过度函数 + superharmonic 函数理论(Thm 10.1.6 引用, Vol II p. 5)。
[X5] J. Doob. Classical Potential Theory and its Probabilistic Counterpart. Springer, 1984. ISBN 978-0387908817. — 经典位势论与概率对偶(Remark 10.1.3-3 引用)。
[X6] S. C. Port, C. J. Stone. Brownian Motion and Classical Potential Theory. Academic Press, 1978. ISBN 978-0125618502. — 2 维 BM superharmonic = 常数的证明(Ex 10.2 引用)。
[X7] F. A. Longstaff, E. S. Schwartz. Valuing American options by simulation: A simple least-squares approach. Review of Financial Studies 14(1): 113–147, 2001. — American option 蒙特卡洛定价(Longstaff-Schwartz 算法)。
[X8] R. Carmona, F. Fouque, L.-H. Sun. Mean field games and systemic risk. Communications in Mathematical Sciences 13(4): 911–924, 2015. — 平均场最优停时(mean field 推广)。
[X9] H. J. Kushner. Probability Methods for Approximations in Stochastic Control and for Elliptic Equations. Academic Press, 1972. ISBN 978-0124316501. — 反射/吸收边界下的最优停时理论。
[X10] J. L. Doob. Classical Potential Theory and its Probabilistic Counterpart. Springer, 1984. — 经典位势论与概率论"对偶"——Ch 10 大量使用。
[X11] I. Karatzas, S. E. Shreve. Brownian Motion and Stochastic Calculus, 2nd ed. Springer, 1991. ISBN 978-0387976556. — 经典 Markov 过程的最优停时理论(KS Ch 4)。
[X12] D. Revuz, M. Yor. Continuous Martingales and Brownian Motion, 3rd ed. Springer, 1999. ISBN 978-3540643253. — Snell 鞅 + 过度函数的标准参考(Ch 10 引用)。