第 29 章主动脉瓣疾病的 AI 诊断与手术规划（Artificial Intelligence-Based Diagnosis and Procedural Planning for Aortic Valve Disease）

作者

Praveen Indraratna, MBBS（通讯作者）—— Department of Radiology, St. Paul's Hospital, Vancouver, Canada；University of British Columbia, Vancouver, Canada。
Jonathon Leipsic, MD —— 同单位；国际知名心血管影像专家，TAVI 规划 CT 应用的先驱（"Vancouver approach" [X18]），现任 Providence Health Care 心脏影像主任。

本章位于 Part III 心脏应用部分，紧接第 28 章（瓣膜 AI 综述）之后，聚焦主动脉瓣——狭窄（AS）、反流（AR）、TAVI 规划。属于"临床应用 + 方法学"双重性质的章节，与第 28 章（瓣膜全景）形成"总论 → 各论"的承接关系。Leipsic 团队的 TAVI 规划工作（Vancouver approach）是国际标准之一，本章自然承接其方法学。

内容概述

主动脉瓣疾病的两大主要病理是狭窄（AS，老年人钙化退行性 + 65 岁以下先天性二叶式）和反流（AR，瓣叶异常 / 主动脉根扩张）。本章按"诊断 → 评估 → 规划 → 风险预测"四段论组织：

AS 的 AI 诊断——基于 ECG 的 DL 筛查（Kwon 2020 [X4]）、基于心音（phonocardiogram）的 ML 商业设备（FDA 批准）、超声心动图 DL 解读（Ghorbani 2020 [X7]）。
AR 的 AI 诊断——心音 DL（Sun 2015 [X9]）、心脏 MRI 相位对比法的 ML 自动分割（Bratt 2019 [X10]）、二叶瓣 vs. 三叶瓣的弱监督分类（Fries 2019 [X13]）。
主动脉评估——Baskaran 2020 [X16] 多结构 DL 分割（dice > 0.95），二叶式主动脉瓣（BAV）相关主动脉病（aortopathy）的 ML 表型分类（Wojnarski 2018 [X15]）。
TAVR 规划 CT——瓣环平面定义、瓣环面积 / 周长测量、冠脉口高度、瓦氏窦大小、升主动脉评估。DL 自动瓣环分割（Astudillo 2019 [X19]，355 例训练 / 118 例测试，处理 < 1 秒），半自动 vs. 全自动测量对比（Lou 2015 [X20]）。
图像质量改进——Ippolito 2020 [X22] 用 80 kV / 60 mL 低剂量 + DL 迭代重建，使剂量长度乘积（DLP）降低 56% 而图像质量无损。
风险预测——NIS-TAVR（Hernandez-Suarez 2019 [X23]）在 10,000+ TAVR 患者中达 AUC 0.92 预测院内死亡，超越传统 STS 评分。

全章贯穿"AI 嵌入式筛查 / 诊断 / 规划 / 风险预测"四阶段，呈现主动脉瓣疾病从社区筛查到术后管理的完整 AI 工具链。

核心方程与概念

1. AS 严重度分级（超声心动图金标准）

AS 严重度由三参数定义： $$V_{\text{peak}} \geq 4.0 \,\text{m/s}, \quad \Delta P_{\text{mean}} \geq 40 \,\text{mmHg}, \quad \text{AVA} \leq 1.0 \,\text{cm}^2$$

其中 $V_{\text{peak}}$ 为跨瓣峰值流速，$\Delta P_{\text{mean}}$ 为平均跨瓣压差，AVA 为连续性方程计算的瓣口面积： $$\text{AVA} = \frac{\text{LVOT}_{\text{area}} \times VTI_{\text{LVOT}}}{VTI_{\text{AS}}}$$

其中 LVOT（左室流出道）面积 = $\pi (D_{\text{LVOT}}/2)^2$，$D_{\text{LVOT}}$ 为 LVOT 直径，VTI 为速度时间积分。

2. ECG-based DL 筛查 AS（Kwon 2020, [X4]）

韩国 Kwon 团队用 39,000+ 12 导联 / 单导联 ECG 训练 DL 模型预测中重度 AS。模型主要特征： - V1–V4 导联 T 波轴 - QT 间期 - 患者年龄

AUC = 0.861，Kwon 团队声称"高于乳腺癌和结直肠癌筛查"——这是个有争议的对比（AS 患病率 ~ 5% 老年，远高于乳腺癌筛查的阳性率），但说明在低成本筛查中 ECG-DL 的潜力。

3. DL 主动脉瓣钙化自动评分（Lessmann 2018, [X8]）

在低剂量胸部 CT 上训练 DL 模型自动 Agatston-style 主动脉瓣钙化评分。挑战：模型难以区分主动脉瓣钙化与主动脉壁钙化（两者都沿主动脉根分布）。该问题在平扫 CT 上尤其突出。

形式化：钙化分割可视为 3D 像素分类任务： $$P(\text{calcium} | \mathbf{x}_{ijk}) = \text{softmax}\left(f_{\text{CNN}}(\mathbf{V})_{(i,j,k)}\right)$$

CNN 用扩张卷积（dilated convolution）扩大感受野，保留高分辨率预测。Agatston 分数： $$S_{\text{Agatston}} = \sum_{i} \max(0, \text{HU}_i - 130) \cdot w_i \cdot \Delta z$$

其中 $w_i$ 为 HU 区间的权重系数，$\Delta z$ 为切片厚度。

4. DL 主动脉瓣环自动分割（Astudillo 2019, [X19]）

用 355 例 TAVR 患者训练两个 DL 模型自动提取瓣环平面（aortic annular plane, AAP）。在 118 例测试集上： - 自动预测与手工分割的面积平均差异 3.3 mm² - 周长平均差异 1.3 mm - 处理时间 < 1 秒

作者认为这"在典型观察者间变异性范围内"——可作为手工测量的"交叉验证"或"独立"工具。

5. 半自动 vs. 全自动瓣环测量对比（Lou 2015, [X20]）

110 例 TAVR 术前 CT： - 半自动（人可调整平面）：80% 测量在瓣环面积 0.5 cm² 内 - 全自动：精度低于半自动

结论：当前 DL 自动化在瓣环测量上仍未达到半自动水平，人工校正仍是临床必需。

6. TAVR 风险预测 ML 模型

NIS-TAVR（Hernandez-Suarez 2019, [X23]）：在美国全国住院样本（NIS）数据库 10,000+ TAVR 患者上训练 ML 模型，院内死亡率 3.6%。ML 模型 AUC = 0.92，显著优于传统风险评分。

451 例单中心（引用 [X24]）：ML 模型 AUC 0.94–0.97，vs. STS 评分 AUC 0.64。但作者承认对操作并发症（卒中、血管并发症、需要起搏的缓慢性心律失常）预测能力差。

半监督 ML 表型分组（Abdul Ghaffar 2020, [X25]）：把 TAVR 患者分为 5 个表型组（按估计死亡率排序），与 STS 评分联合提升预测性能。

7. DL 心脏 MRI 量化左室（Avendi 2016, [X11]；Tao 2019, [X12]）

Avendi：CNN + 可变形模型，LV 分割 dice 系数高
Tao：多厂商多中心验证，DL 全自动 LV 量化与手工高度一致

AR 患者 LV 收缩末期容积（LVESV）是手术指征的核心，DL 自动化让 MRI 量化进入"临床工作流可接受"范围。

8. 弱监督分类二叶瓣 vs. 三叶瓣（Fries 2019, [X13]）

用相位对比 MRI 数据训练弱监督模型识别二叶主动脉瓣。意义：在钙化密集、视觉难辨的情况下辅助诊断。

9. 关键概念辨析

AS 的"低流量、低压差" ：心输出量低时跨瓣压差减小，即使 AS 不严重也可能呈现"假性严重"。CT 钙化评分（Agatston）是关键鉴别工具。
BAV 的临床特殊性：先天性二叶瓣患者 AS 进展更快、AR 更常见、合并主动脉瘤 / 夹层风险高（40% 合并胸主动脉扩张）[X14]。Wojnarski 2018 [X15] 用 ML 把 BAV 主动脉病分为不同表型，提示治疗策略可能需要表型特异。
瓣环面积 vs. 周长：TAVI 假体选择用周长衍生尺寸更稳健（不易受形状非圆影响）。3D 测量 > 2D 测量。
Vancouver approach（Blanke 2016, [X18]）：Leipsic 团队提出的 CT 风险评估框架，包括瓣环上翘、冠脉口高度、瓦氏窦、sinotubular junction 测量，目标是预测冠脉阻塞等致命并发症。
DL 重建 vs. 迭代重建：传统迭代重建（IR）是物理模型 + 优化；DL 重建是从训练数据中学到的非线性映射。DL 重建在低剂量下优势更明显 [X22]。

关键结论

AS 筛查：39,000 例 ECG 的 DL 模型 AUC = 0.861（Kwon 2020 [X4]），适合远程 / 社区大规模筛查。
心音 ML 已商业化（FDA 批准，数字听诊器 + 智能手机 APP）[X5]，可识别 MR / AR / AS 等多种杂音。
超声心动图 DL（Ghorbani 2020 [X7]）自动检测 3 类异常（起搏器导线、左房扩大、LV 肥厚）AUC 0.75–0.89，模型开源。
Lessmann 2018 [X8] DL 主动脉瓣钙化评分：可与人工评分竞争，但区分瓣膜钙化与主动脉壁钙化仍是开放问题。
Astudillo 2019 [X19] DL 瓣环分割：355 例训练 + 118 例测试，面积误差 3.3 mm²、周长误差 1.3 mm、处理 < 1 秒。
Lou 2015 [X20] 对比：全自动 DL 测量精度低于半自动 + 人工校正——纯 DL 工具仍难独立临床使用。
主动脉多结构 DL 分割（Baskaran 2020 [X16]）dice > 0.95，可同时输出主动脉根、瓣环、瓣叶等结构。
低剂量 TAVR 规划 CT：Ippolito 2020 [X22] 用 80 kV + 60 mL 对比剂 + DL 重建，剂量降低 56% 而图像质量无损。
NIS-TAVR（Hernandez-Suarez 2019 [X23]）：10,000+ 患者 ML 模型 AUC 0.92 预测院内死亡，显著超越 STS 评分。
单中心 451 例 ML 死亡率预测 AUC 0.94–0.97 vs. STS 0.64 [X24]，但对操作并发症（卒中、起搏）预测仍弱。
弱监督 ML 在相位对比 MRI 上可识别二叶瓣 [X13]——AI 在"小样本、强特征"任务上有独到价值。
半监督 ML 表型分组（Abdul Ghaffar 2020 [X25]）联合 STS 评分提升 TAVR 风险预测。

挑战和开放性问题

DL 钙化评分区分瓣膜 vs. 主动脉壁：Lessmann 2018 模型在平扫 CT 上仍难做这种区分——这是当前 DL 钙化评分的主要瓶颈。
全自动 vs. 半自动的精度差距：Lou 2015 [X20] 显示全自动 DL 瓣环测量仍逊于半自动 + 人工校正——纯 AI 工具距离独立临床使用仍有距离。
跨厂商 / 跨中心泛化：Leipsic 团队的方法（Vancouver approach）在 St. Paul's Hospital 训练，跨中心应用仍需验证。
ECG-DL 筛查的临床整合：Kwon 2020 [X4] 的 AUC 0.861 看似不错，但 AS 患病率低（< 5% 老年），PPV 受限，假阳性会导致过度转诊。
BAV 表型分类的治疗价值：Wojnarski 2018 [X15] ML 表型分组的临床治疗指导意义仍需前瞻性验证——分类本身不改变治疗时表型分组是否优于传统分类仍未确定。
风险预测的"已知未知"：NIS-TAVR 等模型对卒中、血管并发症、起搏需求等"操作并发症"预测能力差，因为这些事件在训练数据中样本极少且受操作者技术影响。
DL 重建的"幻觉"风险：DL 重建可能在低剂量下"创造"不存在的解剖结构（hallucination），临床使用需谨慎。
AR 的 TAVR 应用证据不足：Arias 2019 [X3] 指出 TAVR 用于纯 AR 证据远不如 AS 充分，AR 患者通常无钙化（瓣环"软"），假体锚定困难。
AI 与人工成本的平衡：自动筛查 / 规划工具的开发与维护成本 vs. 节省的放射科医师时间，需要卫生经济学评估。
多模态融合的潜力：ECG + 心音 + 超声 + CT 联合推理在 AS / AR 诊断上的真正价值未充分挖掘。
临床医生的接受度：AI 工具的"过度依赖"与"过度拒绝"两端都是风险——临床医生需要理解 AI 的工作原理才能合理使用。

个人反思与批判性分析

Leipsic 团队的"机构性偏差"：作者来自 St. Paul's Hospital（Vancouver TAVR 中心），其方法论（Vancouver approach [X18]）是国际标准之一。读者应意识到这是"内部专家撰写的内部方法"，独立验证稀缺。
"AI 优于癌症筛查"的对比有误导性：Kwon 2020 [X4] 声称 AS 筛查 AUC 0.861 高于乳腺癌和结直肠癌筛查——这一对比在统计上不严谨（AS 患病率、参考标准、样本来源完全不同），但反映了 AI 在心血管筛查中的"乐观主义"。
NIS-TAVR 的样本不代表真实世界：全国住院样本数据库（NIS）的标签质量、变量完整性、随访信息都有限。NIS-TAVR AUC 0.92 可能在真实世界降级。
DL 重建的"非物理性"风险：DL 重建在低剂量下能恢复"看起来"不错的图像，但可能引入"幻觉"特征（如原本不存在的伪影被强化）。Ippolito 2020 [X22] 的"图像质量无损"评估基于两名放射科医生的视觉评分，缺乏金标准（如 FBP / IR 真值）对比。
Wojnarski BAV 表型分类的实用性：把 BAV 主动脉病分为不同表型是 ML 的能力，但表型特异治疗策略（"该表型早手术 / 晚手术"）的临床证据不足——这是 ML 走在临床证据前面的典型。
第 28 章 vs. 本章的方法学一致性：第 28 章 Innbruck 团队（Feuchtner）和本章 Vancouver 团队（Leipsic）都是国际瓣膜影像中心，但两家在 AI 工具选择上略有不同（Innbruck 偏商业软件，Vancouver 偏自研 DL）。读者应警惕"地区性偏好"。
"AI 万能"与"AI 仅辅助"的两端：本章在 AS 筛查上偏"AI 万能"（Kwon 2020 优于癌症筛查），在瓣环测量上偏"AI 仅辅助"（全自动 < 半自动）。这种"该强则强、该弱则弱"的诚实表述值得肯定。
与第 28、30、31 章的协同：本章是瓣膜 AS / AR 的专门章节，与第 28 章（瓣膜全景）、第 30 章（可能涉及二尖瓣）、第 31 章（影像组学）有交叉。建议读者读完本章后，回看第 28 章对"瓣膜肿块鉴别"的 HU 阈值方法——会发现 AS / AR 规划更偏 ML / DL，而瓣膜肿块鉴别仍以 HU 阈值为主。

重要参考文献

[X3] Arias EA, Bhan A, Lim ZY, Mullen M. TAVI for pure native aortic regurgitation: are we there yet? Interv Cardiol. 2019;14(1):26-30.
[X4] Kwon JM, Lee SY, Jeon KH, et al. Deep learning based algorithm for detecting aortic stenosis using electrocardiography. J Am Heart Assoc. 2020;9(7):e014717.
[X5] White BE, Shapiro AM, Kanzawa MM, et al. Abstract 13831: handheld wireless digital phonocardiography for machine learning-based detection of mitral regurgitation. Circulation. 2019;140(Suppl_1):A13831-A.
[X7] Ghorbani A, Ouyang D, Abid A, et al. Deep learning interpretation of echocardiograms. NPJ Digital Med. 2020;3(1):10.
[X8] Lessmann N, van Ginneken B, Zreik M, et al. Automatic calcium scoring in low-dose chest CT using deep neural networks with dilated convolutions. IEEE Trans Med Imaging. 2018;37(2):615-25.
[X9] Sun S. An innovative intelligent system based on automatic diagnostic feature extraction for diagnosing heart diseases. Knowledge-Based Syst. 2015;75:224-38.
[X10] Bratt A, Kim J, Pollie M, et al. Machine learning derived segmentation of phase velocity encoded cardiovascular magnetic resonance for fully automated aortic flow quantification. J Cardiovasc Magn Reson. 2019;21(1):1.
[X11] Avendi MR, Kheradvar A, Jafarkhani H. A combined deep-learning and deformable-model approach to fully automatic segmentation of the left ventricle in cardiac MRI. Med Image Anal. 2016;30:108-19.
[X12] Tao Q, Yan W, Wang Y, et al. Deep learning-based method for fully automatic quantification of left ventricle function from cine MR images. Radiology. 2019;290(1):81-8.
[X13] Fries JA, Varma P, Chen VS, et al. Weakly supervised classification of aortic valve malformations using unlabeled cardiac MRI sequences. Nat Commun. 2019;10(1):3111.
[X14] Borger MA, Fedak PWM, Stephens EH, et al. The American Association for Thoracic Surgery consensus guidelines on bicuspid aortic valve-related aortopathy. J Thorac Cardiovasc Surg. 2018;156(2):e41-74.
[X15] Wojnarski CM, Roselli EE, Idrees JJ, et al. Machine-learning phenotypic classification of bicuspid aortopathy. J Thorac Cardiovasc Surg. 2018;155(2):461-9.e4.
[X16] Baskaran L, Al'Aref SJ, Maliakal G, et al. Automatic segmentation of multiple cardiovascular structures from cardiac computed tomography angiography images using deep learning. PLoS One. 2020;15(5):e0232573.
[X18] Blanke P, Soon J, Dvir D, et al. Computed tomography assessment for transcatheter aortic valve implantation: the Vancouver approach to predict anatomical risk for coronary obstruction. J Cardiovasc Comput Tomogr. 2016;10(6):491-9.
[X19] Astudillo P, Mortier P, Bosmans J, et al. Enabling automated device size selection for transcatheter aortic valve implantation. J Interv Cardiol. 2019;2019:3591314.
[X20] Lou J, Obuchowski NA, Krishnaswamy A, et al. Manual, semiautomated, and fully automated measurement of the aortic annulus for planning of TAVR. J Cardiovasc Comput Tomogr. 2015;9(1):42-9.
[X22] Ippolito D, Riva L, Talei Franzesi C, et al. Computed tomography angiography combined with knowledge-based iterative algorithm for TAVI planning: image quality and radiation dose exposure with low-kV and low-contrast-medium protocol. J Comput Assist Tomogr. 2020;44(1):13-9.
[X23] Hernandez-Suarez DF, Kim Y, Villablanca P, et al. Machine learning prediction models for in-hospital mortality after transcatheter aortic valve replacement. JACC Cardiovasc Interv. 2019;12(14):1328-38.
[X24] Gomes B, Pilz M, Reich C, et al. Machine learning-based risk prediction of intrahospital clinical outcomes in patients undergoing TAVI. Clin Res Cardiol. 2021;110:343-56.
[X25] Abdul Ghaffar Y, Osman M, Shrestha S, et al. Usefulness of semisupervised machine-learning-based phenogrouping to improve risk assessment for patients undergoing TAVR. Am J Cardiol. 2020;136:122-30.

第 29 章 主动脉瓣疾病的 AI 诊断与手术规划（Artificial Intelligence-Based Diagnosis and Procedural Planning for Aortic Valve Disease）

作者