第 33 章功能性心脏磁共振的 AI 评估（Artificial Intelligence-Based Evaluation of Functional Cardiac Magnetic Resonance Imaging）

作者

Qian Tao, PhD（通讯作者）—— Department of Imaging Physics, Delft University of Technology, Delft, The Netherlands；Department of Radiology, Leiden University Medical Center, Leiden, The Netherlands。
Rob J. van der Geest, PhD —— Department of Radiology, Leiden University Medical Center。

本章位于 Part III 心脏应用部分，紧接第 32 章（CMR 总体 AI 综述）之后，专注功能性 CMR 分析——心室分割、心脏运动追踪（motion tracking）、功能参数估计。属于"方法学 + 历史综述"性质的章节，按"图像基方法 → 模型基方法 → 数据基方法"三代 AI 范式组织，是本章特有的历史脉络。Tao 与 van der Geest 都来自 Leiden，是国际 CMR AI 研究的重镇。

内容概述

CMR 电影 SSFP（steady-state free precession）序列是评估心功能的金标准——一个完整检查含 ~ 300 帧（多层 × 多相位），手工分割极其耗时；标记 MR（tagged MRI）能更直接追踪心肌运动，但人工追踪几乎不可能。本章按"问题定义 → 三代 AI 方法 → 未来方向"组织：

技术挑战：CMR 图像的高变异性——外部因素（扫描仪、序列、平面、分辨率、对比、噪声、伪影）+ 内部因素（患者间心脏结构、方向、大小差异，尤其病理状态下）。
心脏分割的 AI 方法：
图像基方法（1990s）：动态规划、Sobel/Canny 边缘检测、Snake 主动轮廓、水平集、形态学操作、图割、聚类。
模型基方法（2000s）：ASM（active shape model）+ AAM（active appearance model）+ 多图谱分割（multi-atlas）—— 用 PCA 提取形状子空间，加入先验知识约束。
数据基方法（2010s 后）：FCN、U-Net、ResNet、Inception、ACDC Challenge、M&Ms Challenge 公开数据集。
心脏运动追踪的 AI 方法：
传统方法：DENSE、谐波相位（HARP）、Snake/ASM/AAM、光流、频率分析、配准。
CNN 方法：FlowNetS/FlowNetC 视频光流、合成数据有监督训练、CNN + RNN 标记 MRI 自动追踪。
功能参数估计：心室容积、EF、心肌厚度、应变——给定分割与运动场可直接计算；CNN 还可直接从图像回归到参数（autoencoder + regression）。
当前局限：数据基方法的可解释性差、对分布漂移脆弱、易受对抗攻击；临床部署需在异构数据集上严格验证。

本章的历史脉络（图像基 → 模型基 → 数据基）是 AI 在医学影像中方法论演进的缩影——"知识工程 → 统计学习 → 深度学习"三代。

核心方程与概念

1. CMR 图像变异性来源

外部因素： - 扫描仪厂商（Siemens、GE、Philips） - 序列类型（SSFP、SPAMM tagging、FLASH 等） - 平面与分辨率 - 场强（1.5T vs. 3T） - 对比、亮度、bias field、SNR、伪影

内部因素： - 患者间心脏结构、方向、大小差异 - 病理状态（DCM、HCM、ARVC 等）的几何变异

2. 图像基分割：Snake（主动轮廓）方法

内部能量：$\alpha |\theta'|^2$（连续性） + $\beta |\theta''|^2$（平滑性）
外部能量：$-|\nabla I|^2$（吸引到图像边缘）

通过梯度下降迭代更新： $$\theta^{(t+1)} = \theta^{(t)} - \eta \nabla_\theta C(\theta^{(t)}; I)$$

Snake 的局限：需要良好初始化，易陷入局部极小，对噪声 / 伪影敏感。

3. 水平集（Level Set）方法

把曲线隐式表示为高维函数的零等值面 $\phi(x,y) = 0$。曲线演化通过 $\phi$ 的偏微分方程： $$\frac{\partial \phi}{\partial t} + F |\nabla \phi| = 0$$

其中 $F$ 为速度函数。优势：能处理拓扑变化，对噪声更稳定。

4. 模型基分割：ASM / AAM

Active Shape Model (ASM, Cootes 1995)：从标注形状集合中用 PCA 学习"形状子空间" $\Theta$： $$\Theta = \left\{ \bar{\theta} + \sum_{i=1}^{k} b_i \mathbf{p}_i \mid b_i \in \mathbb{R} \right\}$$

其中 $\bar{\theta}$ 为平均形状，$\mathbf{p}_i$ 为前 $k$ 个主成分。优化问题： $$\hat{\theta} = \arg\min_\theta C(\theta; I) \quad \text{s.t.} \quad \theta \in \Theta$$

Active Appearance Model (AAM)：在 ASM 基础上加上"外观"（appearance）信息，即强度纹理。

多图谱分割（multi-atlas）：用 $N$ 个图谱 $\{(\mathbf{A}_i, \mathbf{S}_i)\}_{i=1}^N$（图像 + 手工分割）对，每个图谱通过非刚性配准传播到目标图像，再融合多个分割结果。

5. 数据基分割：FCN / U-Net

Fully Convolutional Network (FCN, Long 2015)：把全连接层替换为卷积层，输出空间图（pixel-wise classification）。在 CMR 短轴 LV/RV 分割上首次超越传统方法 [X64]。

U-Net (Ronneberger 2015)：编码器-解码器结构 + skip connections，在 ACDC Challenge 2017 [X56] 表现最佳。Tao 2019 [X67] 在多厂商多中心验证 U-Net，LV 分割误差 ~ 1 mm（与观察者间相当）。

6. CNN 损失函数：加权 Dice / Focal Loss

Dice Loss（解决类别不均衡）： $$\mathcal{L}_{\text{Dice}} = 1 - \frac{2 \sum_i p_i y_i}{\sum_i p_i + \sum_i y_i}$$

Focal Loss（解决难样本）： $$\mathcal{L}_{\text{Focal}} = -\alpha (1-p_t)^\gamma \log p_t$$

7. 心脏运动追踪：DENSE 与 HARP

DENSE（Displacement Encoding with Stimulated Echoes）：用双极梯度在 MRI 信号相位中直接编码位移信息。 $$\phi(t) = \gamma \int_0^t \mathbf{G}(\tau) \cdot \mathbf{x}(\tau) d\tau$$

HARP（Harmonic Phase）：对 SPAMM 标签图像做傅里叶变换，提取谐波峰，相位解调得位移场。

8. CNN 运动追踪：FlowNetS / FlowNetC

把电影 CMR 当作"视频"输入，用 FlowNet [X105][X106] 学习光流（optical flow）场： $$\mathbf{v}(\mathbf{x}, t) = f_{\text{CNN}}(\mathbf{I}_t, \mathbf{I}_{t+1}; \theta)$$

心肌运动是"约束"问题（远少于自然场景），训练可在合成数据或带标签的 CMR 上做。

9. 端到端 CNN 功能参数回归

CNN autoencoder 提取低维特征 + 回归网络输出 EF、SV 等： $$\mathbf{h} = f_{\text{encoder}}(\mathbf{I}; \theta_e), \quad \hat{y} = f_{\text{regression}}(\mathbf{h}; \theta_r)$$

联合训练： $$\mathcal{L} = \mathcal{L}_{\text{recon}}(\hat{\mathbf{I}}, \mathbf{I}) + \lambda \mathcal{L}_{\text{pred}}(\hat{y}, y)$$

优势：模拟"经验丰富的放射科医师看一眼 CMR 就估出 EF"的能力。劣势：无可解释性，难以监控。

10. 关键概念辨析

图像基 vs. 模型基 vs. 数据基：图像基只用像素信息（局部、低层）；模型基加入形状 / 外观先验（全局、可解释）；数据基从大规模数据中学到隐式表示（强大但黑盒）。
i.i.d. 假设的违反：数据基方法假设训练 / 测试数据同分布。MRI 厂商差异、序列差异、中心差异、病理差异都违反该假设，导致性能大幅下降。
可解释性 vs. 性能：Snake / ASM 参数可解释（每个参数有物理意义），CNN 不可解释。临床高风险决策需要可解释性——这是 black box AI 的根本缺陷。
对抗攻击：高维参数空间的 CNN 易受微小扰动影响（即使人眼不可见），可能输出错误分割——临床安全风险。
中间结果 vs. 端到端：提供分割中间结果的 AI（可人工校正）优于黑盒端到端输出。
ACDC Challenge [X56] / M&Ms Challenge [X57]：2017、2020 年 CMR 分割公开挑战赛，是 DL 在心脏分割的标准基准。

关键结论

CMR 电影序列 ~ 300 帧，人工分割耗时——AI 是必需。
AI 方法三代演进：图像基（Snake / 水平集）→ 模型基（ASM / AAM / 多图谱）→ 数据基（FCN / U-Net）—— 信息整合度逐步提升。
数据基方法（CNN）目前是 CMR 功能分析 SOTA [X15][X16]。
U-Net 在 ACDC Challenge [X56] 表现最佳；Tao 2019 [X67] 多中心多厂商验证 LV 分割误差 ~ 1 mm。
DCM、HCM、ARVC 等病理下 RV 分割仍未成熟。
心脏运动追踪传统方法包括 DENSE [X90]、HARP [X82]、Snake / ASM / AAM、光流、配准 [X101]——非刚性配准最优。
CNN 运动追踪（FlowNet）[X85] 在异构数据集上超越配准，速度更快。
端到端 CNN 从图像直接回归 EF 等参数 [X114]——模拟"专家一眼估测"能力。
数据基方法的可解释性差、对分布漂移脆弱、易受对抗攻击——临床部署的最大障碍。
公开数据集（ACDC [X56]、M&Ms [X57]、UK Biobank [X66]）是 DL 发展的关键基础设施。
AI 擅长劳动密集型定义明确的任务（分割、追踪），但"高级思维、综合判断"仍是人类优势。

挑战和开放性问题

可解释性：CNN 数百万参数无法直观解释，临床高风险决策难接受黑盒。
分布漂移（distribution shift）：跨厂商 / 跨中心 / 跨病理 / 跨场强都可能让性能大幅下降。
对抗攻击：微小扰动（人眼不可见）可让 CNN 严重错误。
RV 分割未成熟：薄壁、复杂形态、病理下变异大，dice 远低于 LV。
HCM / DCM / ARVC 等罕见表型训练数据不足：CNN 学不到稳健特征。
跨模态 / 跨序列泛化：MOLLI / ShMOLLI / 5(3)3 等 T1 mapping 序列在 T1 值上不完全一致。
多任务学习的耦合：分割 + 运动追踪 + 参数回归联合优化可能比单独训练更好，但工程实现复杂。
联邦学习与隐私保护：跨中心训练受 HIPAA / GDPR 限制，联邦学习是潜在方向但实现复杂。
临床整合路径：从"研究工具"到"PACS 集成插件"需要工程 + 监管 + 经济性验证。
年轻医师技能退化：过度依赖 AI 可能让年轻医师丧失基本技能（手工分割、视觉判读）。
HCM 病理下右心室插入点 LGE 量化：复杂形态下分割错误率仍高。
regulatory 与 legal：FDA / NMPA 审批路径未定，AI 误诊责任不明确。
跨域模型监控：部署后性能随时间漂移（如扫描仪升级），需要持续监控 + 再训练。
物理可解释的 AI 工具：将物理模型（流体力学、生物力学）嵌入 AI 是新兴方向，但实现复杂。

个人反思与批判性分析

历史脉络的"辉格叙事"：本章按"图像基 → 模型基 → 数据基"组织，叙事暗示后者"超越"前者。但读者应意识到：模型基方法（ASM / AAM）在小数据、跨域、可解释性上仍有优势，并非被数据基"取代"。在监管严格的临床场景，模型基 + 小数据 + 可解释的"古典 AI"可能更合适。
"LV 分割问题已解决"是限定结论：Tao 2019 [X67] 的 1 mm 误差是健康 + 简单病理下的结果。在 HCM、DCM、ARVC、CHD 复杂形态下，dice 系数显著下降，临床医生仍需人工校正。
FlowNet 在 CMR 上的"光环"：FlowNet 最初为自然场景光流设计（KITTI、Sintel 等），心肌运动是"约束"问题。读者应警惕跨域迁移的隐性偏差。
端到端 EF 回归的"过拟合"风险：直接从图像到 EF 回归绕过了分割——这意味着模型可能学到与"心脏收缩"无关的捷径（如体型、年龄、性别、扫描参数）。临床使用前需严格验证模型确实在"看心肌"。
i.i.d. 假设的现实违反：作者明确指出 MRI 厂商、中心、患者群差异都违反 i.i.d. 假设。但实际部署中很多团队忽视这一点，报告在自家中心的"高准确率"，跨中心后性能骤降。
ACDC / M&Ms 的"竞赛导向偏差"：公开挑战赛推动了 CMR AI 进步，但冠军模型在挑战赛数据上"过拟合优化"，在真实临床数据上可能表现下降——这是竞赛的局限性。
"高级思维仍是人类优势"的双面性：作者认为 AI 擅长"劳动密集型定义明确任务"，人类擅长"高级思维"——这一定位在监管严格的医疗领域是务实选择。但从长期看，AI 在"综合判断"上的进步可能比"分割精度"的进步更深远。
CMR AI 的"早期阶段"现实：相比 CT-FFR、CAD-RADS 等 CT 端 AI 工具已临床落地，CMR AI 仍处于"研究阶段"——自动分割、参数估计有原型但未广泛临床部署。这反映 CMR 检查量（远少于 CT）和发展时间（短于 CT）的双重限制。
Tao + van der Geest 团队的方法学优势：作者来自 Leiden，是国际 CMR AI 早期开拓者（如 1990s 的 ASM / AAM 工作、2010s 的 U-Net / FlowNet 工作）。读者应意识到这是"内行专家撰写的内行综述"——但学术中立性高，是优秀的入门读物。
与第 32 章的协同：第 32 章是"CMR AI 总体"（采集 / 重建 / 诊断 / 预测），本章专注"功能分析"（分割 / 追踪 / 参数）。两者形成"全栈 vs. 专项"的互补。
"AI 不可解释" vs. "传统方法可解释"的二元论：Snake / ASM 看起来"可解释"，但其实人工调参也很复杂。CNN 的"不可解释"是参数太多——用 Grad-CAM、attention 可视化等工具可部分缓解。
CMR vs. CT 在 AI 上的"时差"：CT 上 AI 工具已商业化（HeartFlow、Siemens cFFR、CAD-RADS 自动化等），CMR 上 AI 工具仍以"研究原型"为主。这一时差与 CMR 检查量、设备成本、临床整合路径相关。

重要参考文献

[X9] Tao Q, Lelieveldt BPF, van der Geest RJ. Deep learning for quantitative cardiac MRI. Am J Roentgenol. 2019;214(3):529-35.
[X15] Shen D, Wu G, Suk H-I. Deep learning in medical image analysis. Annu Rev Biomed Eng. 2017;19(1):221-48.
[X16] Litjens G, Kooi T, Bejnordi BE, et al. A survey on deep learning in medical image analysis. Med Image Anal. 2017;42:60-88.
[X19] Kass M, Witkin A, Terzopoulos D. Snakes: active contour models. Int J Comput Vis. 1988;1(4):321-31.
[X20] Lee H, Codella NCF, Cham MD, Weinsaft JW, Wang Y. Automatic left ventricle segmentation using iterative thresholding and an active contour model with adaptation on short-axis cardiac MRI. IEEE Trans Biomed Eng. 2010;57(4):905-13.
[X25] Osher S, Fedkiw R. Level set methods and dynamic implicit surfaces. New York: Springer; 2003.
[X37] Cootes TF, Taylor CJ, Cooper DH, Graham J. Active shape models - their training and application. Comput Vis Image Underst. 1995;61(1):38-59.
[X45] Lorenzo-Valdés M, Sanchez-Ortiz GI, Mohiaddin R, Rueckert D. Atlas-based segmentation and tracking of 3D cardiac MR images using non-rigid registration. MICCAI 2002.
[X47] Zhuang X, Rhode KS, Razavi RS, et al. A registration-based propagation framework for automatic whole heart segmentation of cardiac MRI. IEEE Trans Med Imaging. 2010;29(9):1612-25.
[X56] Bernard O, Lalande A, Zotti C, et al. Deep learning techniques for automatic MRI cardiac multi-structures segmentation and diagnosis. IEEE Trans Med Imaging. 2018;37(11):2514-25.
[X57] Scannell CM, Chiribiri A, Veta M. Domain-adversarial learning for multi-centre, multi-vendor, and multi-disease cardiac MR image segmentation. arXiv:200811776. 2020.
[X60] Avendi MR, Kheradvar A, Jafarkhani H. A combined deep-learning and deformable-model approach to fully automatic segmentation of the left ventricle in cardiac MRI. Med Image Anal. 2016;30:108-19.
[X64] Tran PV. A fully convolutional neural network for cardiac segmentation in short-axis MRI. arXiv:160400494. 2017.
[X65] Bai W, Sinclair M, Tarroni G, et al. Automated cardiovascular magnetic resonance image analysis with fully convolutional networks. J Cardiovasc Magn Reson. 2018;20(1):65.
[X66] Sudlow C, Gallacher J, Allen N, et al. UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. PLoS Med. 2015;12(3):e1001779.
[X67] Tao Q, Yan W, Wang Y, et al. Deep learning-based method for fully automatic quantification of left ventricle function from cine MR images: a multivendor, multicenter study. Radiology. 2019;290(1):81-8.
[X82] Osman NF, Kerwin WS, McVeigh ER, Prince JL. Cardiac motion tracking using CINE harmonic phase (HARP) magnetic resonance imaging. Magn Reson Med. 1999;42(6):1048-60.
[X84] Maret E, Todt T, Ljungberg A, et al. Functional measurements based on feature tracking of cine magnetic resonance images identify left ventricular segments with myocardial scar by cardiovascular magnetic resonance. Clin Physiol Funct Imaging. 2011;31:435-44.
[X85] Yan W, Wang Y, van der Geest RJ, Tao Q. Cine MRI analysis by deep learning of optical flow. Comput Biol Med. 2019;111:103356.
[X90] Aletras AH, Ding S, Balaban RS, Wen H. DENSE: displacement encoding with stimulated echoes in cardiac functional MRI. J Magn Reson. 1999;137:247-52.
[X101] Chandrashekara R, Mohiaddin RH, Rueckert D. Analysis of 3-D myocardial motion in tagged MR images using nonrigid image registration. IEEE Trans Med Imaging. 2004;23(10):1245-50.
[X105] Dosovitskiy A, Fischer P, Ilg E, et al. FlowNet: learning optical flow with convolutional networks. ICCV 2015.
[X106] Ilg E, Mayer N, Saikia T, et al. FlowNet 2.0: evolution of optical flow estimation with deep networks. CVPR 2017.
[X107] Sokooti H, de Vos B, Berendsen F, et al. Nonrigid image registration using multi-scale 3D convolutional neural networks. MICCAI 2017.
[X110] Zhang N, Yang G, Gao Z, et al. Deep learning for diagnosis of chronic myocardial infarction on nonenhanced cardiac cine MRI. Radiology. 2019;291(3):606-17.
[X111] Fu Y, Lei Y, Wang T, et al. Deep learning in medical image registration: a review. Phys Med Biol. 2020;65:20TR01.
[X114] Luo C, Shi C, Li X, Gao D. Cardiac MR segmentation based on sequence propagation by deep learning. PLoS One. 2020;15(4):e0230415.
[X117] Selvaraju RR, Cogswell M, Das A, et al. Grad-CAM: visual explanations from deep networks via gradient-based localization. ICCV 2017.
[X118] Goodfellow IJ, Shlens J, Szegedy C. Explaining and harnessing adversarial examples. ICLR 2015.
[X120] Finlayson SG, Bowers JD, Ito J, et al. Adversarial attacks against medical deep learning systems. Science. 2019;363:1287-9.
[X121] Ma X, Niu Y, Gu L, et al. Understanding adversarial attacks on deep learning based medical image analysis systems. Pattern Recognit. 2021;107:107-498.

第 33 章 功能性心脏磁共振的 AI 评估（Artificial Intelligence-Based Evaluation of Functional Cardiac Magnetic Resonance Imaging）

作者