第 29 章 主动脉瓣疾病的 AI 诊断与手术规划(Artificial Intelligence-Based Diagnosis and Procedural Planning for Aortic Valve Disease)
作者
- Praveen Indraratna, MBBS(通讯作者)—— Department of Radiology, St. Paul's Hospital, Vancouver, Canada;University of British Columbia, Vancouver, Canada。
- Jonathon Leipsic, MD —— 同单位;国际知名心血管影像专家,TAVI 规划 CT 应用的先驱("Vancouver approach" [X18]),现任 Providence Health Care 心脏影像主任。
本章位于 Part III 心脏应用部分,紧接第 28 章(瓣膜 AI 综述)之后,聚焦主动脉瓣——狭窄(AS)、反流(AR)、TAVI 规划。属于"临床应用 + 方法学"双重性质的章节,与第 28 章(瓣膜全景)形成"总论 → 各论"的承接关系。Leipsic 团队的 TAVI 规划工作(Vancouver approach)是国际标准之一,本章自然承接其方法学。
内容概述
主动脉瓣疾病的两大主要病理是狭窄(AS,老年人钙化退行性 + 65 岁以下先天性二叶式)和反流(AR,瓣叶异常 / 主动脉根扩张)。本章按"诊断 → 评估 → 规划 → 风险预测"四段论组织:
- AS 的 AI 诊断——基于 ECG 的 DL 筛查(Kwon 2020 [X4])、基于心音(phonocardiogram)的 ML 商业设备(FDA 批准)、超声心动图 DL 解读(Ghorbani 2020 [X7])。
- AR 的 AI 诊断——心音 DL(Sun 2015 [X9])、心脏 MRI 相位对比法的 ML 自动分割(Bratt 2019 [X10])、二叶瓣 vs. 三叶瓣的弱监督分类(Fries 2019 [X13])。
- 主动脉评估——Baskaran 2020 [X16] 多结构 DL 分割(dice > 0.95),二叶式主动脉瓣(BAV)相关主动脉病(aortopathy)的 ML 表型分类(Wojnarski 2018 [X15])。
- TAVR 规划 CT——瓣环平面定义、瓣环面积 / 周长测量、冠脉口高度、瓦氏窦大小、升主动脉评估。DL 自动瓣环分割(Astudillo 2019 [X19],355 例训练 / 118 例测试,处理 < 1 秒),半自动 vs. 全自动测量对比(Lou 2015 [X20])。
- 图像质量改进——Ippolito 2020 [X22] 用 80 kV / 60 mL 低剂量 + DL 迭代重建,使剂量长度乘积(DLP)降低 56% 而图像质量无损。
- 风险预测——NIS-TAVR(Hernandez-Suarez 2019 [X23])在 10,000+ TAVR 患者中达 AUC 0.92 预测院内死亡,超越传统 STS 评分。
全章贯穿"AI 嵌入式筛查 / 诊断 / 规划 / 风险预测"四阶段,呈现主动脉瓣疾病从社区筛查到术后管理的完整 AI 工具链。
核心方程与概念
1. AS 严重度分级(超声心动图金标准)
AS 严重度由三参数定义: $\(V_{\text{peak}} \geq 4.0 \,\text{m/s}, \quad \Delta P_{\text{mean}} \geq 40 \,\text{mmHg}, \quad \text{AVA} \leq 1.0 \,\text{cm}^2\)$
其中 \(V_{\text{peak}}\) 为跨瓣峰值流速,\(\Delta P_{\text{mean}}\) 为平均跨瓣压差,AVA 为连续性方程计算的瓣口面积: $\(\text{AVA} = \frac{\text{LVOT}_{\text{area}} \times VTI_{\text{LVOT}}}{VTI_{\text{AS}}}\)$
其中 LVOT(左室流出道)面积 = \(\pi (D_{\text{LVOT}}/2)^2\),\(D_{\text{LVOT}}\) 为 LVOT 直径,VTI 为速度时间积分。
2. ECG-based DL 筛查 AS(Kwon 2020, [X4])
韩国 Kwon 团队用 39,000+ 12 导联 / 单导联 ECG 训练 DL 模型预测中重度 AS。模型主要特征: - V1–V4 导联 T 波轴 - QT 间期 - 患者年龄
AUC = 0.861,Kwon 团队声称"高于乳腺癌和结直肠癌筛查"——这是个有争议的对比(AS 患病率 ~ 5% 老年,远高于乳腺癌筛查的阳性率),但说明在低成本筛查中 ECG-DL 的潜力。
3. DL 主动脉瓣钙化自动评分(Lessmann 2018, [X8])
在低剂量胸部 CT 上训练 DL 模型自动 Agatston-style 主动脉瓣钙化评分。挑战:模型难以区分主动脉瓣钙化与主动脉壁钙化(两者都沿主动脉根分布)。该问题在平扫 CT 上尤其突出。
形式化:钙化分割可视为 3D 像素分类任务: $\(P(\text{calcium} | \mathbf{x}_{ijk}) = \text{softmax}\left(f_{\text{CNN}}(\mathbf{V})_{(i,j,k)}\right)\)$
CNN 用扩张卷积(dilated convolution)扩大感受野,保留高分辨率预测。Agatston 分数: $\(S_{\text{Agatston}} = \sum_{i} \max(0, \text{HU}_i - 130) \cdot w_i \cdot \Delta z\)$
其中 \(w_i\) 为 HU 区间的权重系数,\(\Delta z\) 为切片厚度。
4. DL 主动脉瓣环自动分割(Astudillo 2019, [X19])
用 355 例 TAVR 患者训练两个 DL 模型自动提取瓣环平面(aortic annular plane, AAP)。在 118 例测试集上: - 自动预测与手工分割的面积平均差异 3.3 mm² - 周长平均差异 1.3 mm - 处理时间 < 1 秒
作者认为这"在典型观察者间变异性范围内"——可作为手工测量的"交叉验证"或"独立"工具。
5. 半自动 vs. 全自动瓣环测量对比(Lou 2015, [X20])
110 例 TAVR 术前 CT: - 半自动(人可调整平面):80% 测量在瓣环面积 0.5 cm² 内 - 全自动:精度低于半自动
结论:当前 DL 自动化在瓣环测量上仍未达到半自动水平,人工校正仍是临床必需。
6. TAVR 风险预测 ML 模型
NIS-TAVR(Hernandez-Suarez 2019, [X23]):在美国全国住院样本(NIS)数据库 10,000+ TAVR 患者上训练 ML 模型,院内死亡率 3.6%。ML 模型 AUC = 0.92,显著优于传统风险评分。
451 例单中心(引用 [X24]):ML 模型 AUC 0.94–0.97,vs. STS 评分 AUC 0.64。但作者承认对操作并发症(卒中、血管并发症、需要起搏的缓慢性心律失常)预测能力差。
半监督 ML 表型分组(Abdul Ghaffar 2020, [X25]):把 TAVR 患者分为 5 个表型组(按估计死亡率排序),与 STS 评分联合提升预测性能。
7. DL 心脏 MRI 量化左室(Avendi 2016, [X11];Tao 2019, [X12])
- Avendi:CNN + 可变形模型,LV 分割 dice 系数高
- Tao:多厂商多中心验证,DL 全自动 LV 量化与手工高度一致
AR 患者 LV 收缩末期容积(LVESV)是手术指征的核心,DL 自动化让 MRI 量化进入"临床工作流可接受"范围。
8. 弱监督分类二叶瓣 vs. 三叶瓣(Fries 2019, [X13])
用相位对比 MRI 数据训练弱监督模型识别二叶主动脉瓣。意义:在钙化密集、视觉难辨的情况下辅助诊断。
9. 关键概念辨析
- AS 的"低流量、低压差" :心输出量低时跨瓣压差减小,即使 AS 不严重也可能呈现"假性严重"。CT 钙化评分(Agatston)是关键鉴别工具。
- BAV 的临床特殊性:先天性二叶瓣患者 AS 进展更快、AR 更常见、合并主动脉瘤 / 夹层风险高(40% 合并胸主动脉扩张)[X14]。Wojnarski 2018 [X15] 用 ML 把 BAV 主动脉病分为不同表型,提示治疗策略可能需要表型特异。
- 瓣环面积 vs. 周长:TAVI 假体选择用周长衍生尺寸更稳健(不易受形状非圆影响)。3D 测量 > 2D 测量。
- Vancouver approach(Blanke 2016, [X18]):Leipsic 团队提出的 CT 风险评估框架,包括瓣环上翘、冠脉口高度、瓦氏窦、sinotubular junction 测量,目标是预测冠脉阻塞等致命并发症。
- DL 重建 vs. 迭代重建:传统迭代重建(IR)是物理模型 + 优化;DL 重建是从训练数据中学到的非线性映射。DL 重建在低剂量下优势更明显 [X22]。
关键结论
- AS 筛查:39,000 例 ECG 的 DL 模型 AUC = 0.861(Kwon 2020 [X4]),适合远程 / 社区大规模筛查。
- 心音 ML 已商业化(FDA 批准,数字听诊器 + 智能手机 APP)[X5],可识别 MR / AR / AS 等多种杂音。
- 超声心动图 DL(Ghorbani 2020 [X7])自动检测 3 类异常(起搏器导线、左房扩大、LV 肥厚)AUC 0.75–0.89,模型开源。
- Lessmann 2018 [X8] DL 主动脉瓣钙化评分:可与人工评分竞争,但区分瓣膜钙化与主动脉壁钙化仍是开放问题。
- Astudillo 2019 [X19] DL 瓣环分割:355 例训练 + 118 例测试,面积误差 3.3 mm²、周长误差 1.3 mm、处理 < 1 秒。
- Lou 2015 [X20] 对比:全自动 DL 测量精度低于半自动 + 人工校正——纯 DL 工具仍难独立临床使用。
- 主动脉多结构 DL 分割(Baskaran 2020 [X16])dice > 0.95,可同时输出主动脉根、瓣环、瓣叶等结构。
- 低剂量 TAVR 规划 CT:Ippolito 2020 [X22] 用 80 kV + 60 mL 对比剂 + DL 重建,剂量降低 56% 而图像质量无损。
- NIS-TAVR(Hernandez-Suarez 2019 [X23]):10,000+ 患者 ML 模型 AUC 0.92 预测院内死亡,显著超越 STS 评分。
- 单中心 451 例 ML 死亡率预测 AUC 0.94–0.97 vs. STS 0.64 [X24],但对操作并发症(卒中、起搏)预测仍弱。
- 弱监督 ML 在相位对比 MRI 上可识别二叶瓣 [X13]——AI 在"小样本、强特征"任务上有独到价值。
- 半监督 ML 表型分组(Abdul Ghaffar 2020 [X25])联合 STS 评分提升 TAVR 风险预测。
挑战和开放性问题
- DL 钙化评分区分瓣膜 vs. 主动脉壁:Lessmann 2018 模型在平扫 CT 上仍难做这种区分——这是当前 DL 钙化评分的主要瓶颈。
- 全自动 vs. 半自动的精度差距:Lou 2015 [X20] 显示全自动 DL 瓣环测量仍逊于半自动 + 人工校正——纯 AI 工具距离独立临床使用仍有距离。
- 跨厂商 / 跨中心泛化:Leipsic 团队的方法(Vancouver approach)在 St. Paul's Hospital 训练,跨中心应用仍需验证。
- ECG-DL 筛查的临床整合:Kwon 2020 [X4] 的 AUC 0.861 看似不错,但 AS 患病率低(< 5% 老年),PPV 受限,假阳性会导致过度转诊。
- BAV 表型分类的治疗价值:Wojnarski 2018 [X15] ML 表型分组的临床治疗指导意义仍需前瞻性验证——分类本身不改变治疗时表型分组是否优于传统分类仍未确定。
- 风险预测的"已知未知":NIS-TAVR 等模型对卒中、血管并发症、起搏需求等"操作并发症"预测能力差,因为这些事件在训练数据中样本极少且受操作者技术影响。
- DL 重建的"幻觉"风险:DL 重建可能在低剂量下"创造"不存在的解剖结构(hallucination),临床使用需谨慎。
- AR 的 TAVR 应用证据不足:Arias 2019 [X3] 指出 TAVR 用于纯 AR 证据远不如 AS 充分,AR 患者通常无钙化(瓣环"软"),假体锚定困难。
- AI 与人工成本的平衡:自动筛查 / 规划工具的开发与维护成本 vs. 节省的放射科医师时间,需要卫生经济学评估。
- 多模态融合的潜力:ECG + 心音 + 超声 + CT 联合推理在 AS / AR 诊断上的真正价值未充分挖掘。
- 临床医生的接受度:AI 工具的"过度依赖"与"过度拒绝"两端都是风险——临床医生需要理解 AI 的工作原理才能合理使用。
个人反思与批判性分析
- Leipsic 团队的"机构性偏差":作者来自 St. Paul's Hospital(Vancouver TAVR 中心),其方法论(Vancouver approach [X18])是国际标准之一。读者应意识到这是"内部专家撰写的内部方法",独立验证稀缺。
- "AI 优于癌症筛查"的对比有误导性:Kwon 2020 [X4] 声称 AS 筛查 AUC 0.861 高于乳腺癌和结直肠癌筛查——这一对比在统计上不严谨(AS 患病率、参考标准、样本来源完全不同),但反映了 AI 在心血管筛查中的"乐观主义"。
- NIS-TAVR 的样本不代表真实世界:全国住院样本数据库(NIS)的标签质量、变量完整性、随访信息都有限。NIS-TAVR AUC 0.92 可能在真实世界降级。
- DL 重建的"非物理性"风险:DL 重建在低剂量下能恢复"看起来"不错的图像,但可能引入"幻觉"特征(如原本不存在的伪影被强化)。Ippolito 2020 [X22] 的"图像质量无损"评估基于两名放射科医生的视觉评分,缺乏金标准(如 FBP / IR 真值)对比。
- Wojnarski BAV 表型分类的实用性:把 BAV 主动脉病分为不同表型是 ML 的能力,但表型特异治疗策略("该表型早手术 / 晚手术")的临床证据不足——这是 ML 走在临床证据前面的典型。
- 第 28 章 vs. 本章的方法学一致性:第 28 章 Innbruck 团队(Feuchtner)和本章 Vancouver 团队(Leipsic)都是国际瓣膜影像中心,但两家在 AI 工具选择上略有不同(Innbruck 偏商业软件,Vancouver 偏自研 DL)。读者应警惕"地区性偏好"。
- "AI 万能"与"AI 仅辅助"的两端:本章在 AS 筛查上偏"AI 万能"(Kwon 2020 优于癌症筛查),在瓣环测量上偏"AI 仅辅助"(全自动 < 半自动)。这种"该强则强、该弱则弱"的诚实表述值得肯定。
- 与第 28、30、31 章的协同:本章是瓣膜 AS / AR 的专门章节,与第 28 章(瓣膜全景)、第 30 章(可能涉及二尖瓣)、第 31 章(影像组学)有交叉。建议读者读完本章后,回看第 28 章对"瓣膜肿块鉴别"的 HU 阈值方法——会发现 AS / AR 规划更偏 ML / DL,而瓣膜肿块鉴别仍以 HU 阈值为主。
重要参考文献
- [X3] Arias EA, Bhan A, Lim ZY, Mullen M. TAVI for pure native aortic regurgitation: are we there yet? Interv Cardiol. 2019;14(1):26-30.
- [X4] Kwon JM, Lee SY, Jeon KH, et al. Deep learning based algorithm for detecting aortic stenosis using electrocardiography. J Am Heart Assoc. 2020;9(7):e014717.
- [X5] White BE, Shapiro AM, Kanzawa MM, et al. Abstract 13831: handheld wireless digital phonocardiography for machine learning-based detection of mitral regurgitation. Circulation. 2019;140(Suppl_1):A13831-A.
- [X7] Ghorbani A, Ouyang D, Abid A, et al. Deep learning interpretation of echocardiograms. NPJ Digital Med. 2020;3(1):10.
- [X8] Lessmann N, van Ginneken B, Zreik M, et al. Automatic calcium scoring in low-dose chest CT using deep neural networks with dilated convolutions. IEEE Trans Med Imaging. 2018;37(2):615-25.
- [X9] Sun S. An innovative intelligent system based on automatic diagnostic feature extraction for diagnosing heart diseases. Knowledge-Based Syst. 2015;75:224-38.
- [X10] Bratt A, Kim J, Pollie M, et al. Machine learning derived segmentation of phase velocity encoded cardiovascular magnetic resonance for fully automated aortic flow quantification. J Cardiovasc Magn Reson. 2019;21(1):1.
- [X11] Avendi MR, Kheradvar A, Jafarkhani H. A combined deep-learning and deformable-model approach to fully automatic segmentation of the left ventricle in cardiac MRI. Med Image Anal. 2016;30:108-19.
- [X12] Tao Q, Yan W, Wang Y, et al. Deep learning-based method for fully automatic quantification of left ventricle function from cine MR images. Radiology. 2019;290(1):81-8.
- [X13] Fries JA, Varma P, Chen VS, et al. Weakly supervised classification of aortic valve malformations using unlabeled cardiac MRI sequences. Nat Commun. 2019;10(1):3111.
- [X14] Borger MA, Fedak PWM, Stephens EH, et al. The American Association for Thoracic Surgery consensus guidelines on bicuspid aortic valve-related aortopathy. J Thorac Cardiovasc Surg. 2018;156(2):e41-74.
- [X15] Wojnarski CM, Roselli EE, Idrees JJ, et al. Machine-learning phenotypic classification of bicuspid aortopathy. J Thorac Cardiovasc Surg. 2018;155(2):461-9.e4.
- [X16] Baskaran L, Al'Aref SJ, Maliakal G, et al. Automatic segmentation of multiple cardiovascular structures from cardiac computed tomography angiography images using deep learning. PLoS One. 2020;15(5):e0232573.
- [X18] Blanke P, Soon J, Dvir D, et al. Computed tomography assessment for transcatheter aortic valve implantation: the Vancouver approach to predict anatomical risk for coronary obstruction. J Cardiovasc Comput Tomogr. 2016;10(6):491-9.
- [X19] Astudillo P, Mortier P, Bosmans J, et al. Enabling automated device size selection for transcatheter aortic valve implantation. J Interv Cardiol. 2019;2019:3591314.
- [X20] Lou J, Obuchowski NA, Krishnaswamy A, et al. Manual, semiautomated, and fully automated measurement of the aortic annulus for planning of TAVR. J Cardiovasc Comput Tomogr. 2015;9(1):42-9.
- [X22] Ippolito D, Riva L, Talei Franzesi C, et al. Computed tomography angiography combined with knowledge-based iterative algorithm for TAVI planning: image quality and radiation dose exposure with low-kV and low-contrast-medium protocol. J Comput Assist Tomogr. 2020;44(1):13-9.
- [X23] Hernandez-Suarez DF, Kim Y, Villablanca P, et al. Machine learning prediction models for in-hospital mortality after transcatheter aortic valve replacement. JACC Cardiovasc Interv. 2019;12(14):1328-38.
- [X24] Gomes B, Pilz M, Reich C, et al. Machine learning-based risk prediction of intrahospital clinical outcomes in patients undergoing TAVI. Clin Res Cardiol. 2021;110:343-56.
- [X25] Abdul Ghaffar Y, Osman M, Shrestha S, et al. Usefulness of semisupervised machine-learning-based phenogrouping to improve risk assessment for patients undergoing TAVR. Am J Cardiol. 2020;136:122-30.